TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Samankaltaiset tiedostot
TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI LTKY012. Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Johdatus tilastotieteeseen Tilastollisten aineistojen kerääminen ja mittaaminen. TKK (c) Ilkka Mellin (2004) 1

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Johdatus tilastotieteeseen Tilastollisten aineistojen kerääminen ja mittaaminen. TKK (c) Ilkka Mellin (2005) 1

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

Tilastollisten aineistojen kerääminen ja mittaaminen

Populaatio tutkimusobjektien muodostama joukko, johon tilastollinen tutkimus kohdistuu, koko N

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Tilastollisten aineistojen kerääminen ja mittaaminen. Tilastollisten aineistojen kerääminen ja mittaaminen

Sovellettu todennäköisyyslaskenta B

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

Otannasta ja mittaamisesta

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Mittaaminen menettely (sääntö), jolla tilastoyksikköön liitetään tiettyä ominaisuutta kuvaava luku, mittaluku.

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

1. Johdanto Todennäköisyysotanta Yksinkertainen satunnaisotanta Ositettu otanta Systemaattinen otanta...

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI. LTKY012 Timo Törmäkangas Gerontologian tutkimuskeskus

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Tehtävä 1. Hypoteesi: Liikuntaneuvonta on hyvä keino vaikuttaa terveydentilaan. Onko edellinen hypoteesi hyvä tutkimushypoteesi? Kyllä.

Ohjeita kvantitatiiviseen tutkimukseen

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1

pitkittäisaineistoissa

Mat Tilastollisen analyysin perusteet, kevät 2007

Harjoitus 7: NCSS - Tilastollinen analyysi

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?

Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

MONISTE 2 Kirjoittanut Elina Katainen

Testit laatueroasteikollisille muuttujille

Väliestimointi (jatkoa) Heliövaara 1

Kvantitatiivisen aineiston analyysi

ABHELSINKI UNIVERSITY OF TECHNOLOGY

pitkittäisaineistoissa

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

MTTTP1 Tilastotieteen johdantokurssi Luento JOHDANTO

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Tilastollisen tutkimuksen vaiheet

b6) samaan perusjoukkoon kohdistuu samanaikaisesti useampia tutkimuksia.

Luentotesti 3. Kun tutkimuksen kävelynopeustietoja analysoidaan, onko näiden tutkittavien aiheuttama kato

Sovellettu todennäköisyyslaskenta B

Tilastotieteen kertaus. Kuusinen/Heliövaara 1

Luentokalvoja tilastollisesta päättelystä. Kalvot laatinut Aki Taanila Päivitetty

Kandidaatintutkielman aineistonhankinta ja analyysi

tilastotieteen kertaus

Testejä suhdeasteikollisille muuttujille

Teema 8: Parametrien estimointi ja luottamusvälit

r = n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit.

Kvantitatiiviset menetelmät

HAVAITUT JA ODOTETUT FREKVENSSIT

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

LIITE 1 VIRHEEN ARVIOINNISTA

Yhteistyöaineiden edustajan puheenvuoro

Ohjeita kvantitatiiviseen tutkimukseen

Ohjeita kvantitatiiviseen tutkimukseen

Monitasomallit koulututkimuksessa

LIITE 1 VIRHEEN ARVIOINNISTA

Testit järjestysasteikollisille muuttujille

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu

KVANTITATIIVINEN TUTKIMUS

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

LIITE 1 VIRHEEN ARVIOINNISTA

Harjoitus 2: Matlab - Statistical Toolbox

Sovellettu todennäköisyyslaskenta B

Poimi yrityksistä i) neljän, ii) kymmenen suuruinen otos. a) yksinkertaisella satunnaisotannalla palauttaen, b) systemaattisella otannalla

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu

Mat Tilastollisen analyysin perusteet, kevät 2007

Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi

Hannu mies LTK 180 Johanna nainen HuTK 168 Laura nainen LuTK 173 Jere mies NA 173 Riitta nainen LTK 164

1. Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet

Matemaatikot ja tilastotieteilijät

Johdatus tilastotieteeseen Tilastolliset testit. TKK (c) Ilkka Mellin (2005) 1

Mitä tarvitsee tietää biostatistiikasta ja miksi? Matti Uhari Lastentautien klinikka Oulun yliopisto

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi. Viikko 5

Lohkoasetelmat. Vilkkumaa / Kuusinen 1

¼ ¼ joten tulokset ovat muuttuneet ja nimenomaan huontontuneet eivätkä tulleet paremmiksi.

Mat Tilastollisen analyysin perusteet, kevät 2007

Osa 2: Otokset, otosjakaumat ja estimointi

pisteet Frekvenssi frekvenssi Yhteensä

Teema 3: Tilastollisia kuvia ja tunnuslukuja

Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit

Tilastolliset testit. Tilastolliset testit. Tilastolliset testit: Mitä opimme? 2/5. Tilastolliset testit: Mitä opimme? 1/5

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Mat Tilastollisen analyysin perusteet. Tilastollisten aineistojen kerääminen ja mittaaminen Tilastollisten aineistojen kuvaaminen Väliestimointi

Sovellettu todennäköisyyslaskenta B

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

Ongelma: Poikkeaako perusjoukon suhteellinen osuus vertailuarvosta?

Kandidaatintutkielman aineistonkeruu ja analyysi

Tutkiva ja kehittävä osaaja (3 op) Kyselyaineisto keruumenetelmänä opinnäytetyössä Ismo Vuorinen

Transkriptio:

TUTKIMUSAINEISTON ANALYYSI LTKY012 Timo Törmäkangas

KURSSIN SISÄLTÖ Johdanto Mittaaminen ja aineiston hankinta Mitta-asteikot Otanta Aineiston esittäminen ja data-analyysi Havaintomatriisi Yksiulotteisen empiirisen jakauman esittäminen Frekvenssijakauma Luokittelu Kuviot Tunnusluvut Kaksiulotteisen jakauman esittäminen ja riippuvuus Ristiintaulukko ja kuviot Riippuvuuden tunnusluvut Vähän todennäköisyydestä Otantajakauma Tilastollinen päätöksenteko Estimointi Hypoteesien testaus Perustestejä Keskiarvotestit, varianssianalyysit Riippuvuuden testit

KVANTITATIIVISEN TUTKIMUKSEN VAIHEET(EI VALMISTA AINEISTOA) 1. Tutkimusongelman määrittäminen Kirjallisuuteen perehtyminen 2. Suunnitteluvaihe Ongelman yksityiskohtaisempi määrittely Teorian valinta ja hypoteesien laadinta Konkretisointi Mittareiden ja menetelmien valinta Aineiston keruun suunnittelu Analyysin suunnittelu Raportoinnin suunnittelu 3. Kenttätyövaihe eli aineiston keruu 4. Tietojen tallennus ja muokkaus analyysia varten 5. Tietojen analysointi ja johtopäätösten teko 6. Tutkimuksen raportointi

TUTKIMUSKYSYMYS Tutkimus lähtee liikkeelle siitä, että halutaan tarkastella jotakin todellisuuden ilmiötä ja tarkastelu puetaan usein kysymyksen muotoon Esim. Onko fyysisellä aktiivisuudella vaikutusta kuoleman riskiin? Tutkimuskysymyksestä muodostetaan tutkimushypoteesi, jossa otetaan kantaa siihen, mikä olisi mahdollinen vastaus tutkimuskysymykseen Esim. Tutkittavilla, joilla on korkea fyysisen aktiivisuuden taso, on alhaisempi riski kuolemalle kuin niillä tutkittavilla, joilla on matala aktiivisuuden taso? Lisäksi usein määritetään tilastollisen testauksen hypoteesit (näistä myöhemmin)

HYVÄ HYPOTEESI Esittää yksiselitteisen suhteen kahden tutkittavan asian välille On perusteltu (teoria tai muut syyt) On empiirisesti testattavissa On lyhyt ja selkeä Kvantitatiivisessa tutkimuksessa hypoteesilla on yleensä matemaattinen vastine Hypoteesi: r 1 >r 0, missä ron kuolleisuusriskin, ja indeksi 0 = matalaa fyysisen aktiivisuuden taso ja 1 = korkea fyysisen aktiivisuuden taso

TEOREETTINEN MALLI JA MITTAAMINEN Kvantitatiiviseen tutkimusotteeseen kuuluu, että tarkasteltavasta ilmiöstä luodaan malli Malliin kuuluvat tutkimusobjektit Tutkimusobjektien ominaisuudetmääritellään teoreettisilla termeillä Termitkäännetään empiirisiksikvantitatiivista tutkimusta varten Jokaiseen termiin liitetään mittaoperaatio Ominaisuuttasaadaan näin kuvaamaan lukuarvo, mittaluku(mittaoperaatio) Mittaaminen on toimenpide, jolla tutkimusobjektiin liitetään jotain sen ominaisuutta kuvaava luku eli mittaluku

MITTAAMISEN KÄSITTEITÄ Mittaoperaation säännöt ja välineet = mittari Objekti, jolle mittaus suoritetaan on havaintoyksikkö, tapaus, tutkittava(case) Ominaisuus, jota mitataan on muuttuja (variable) Ominaisuus voi saada erilaisia lukuarvoja, jotka ovat muuttujan havaintoarvojatai luokkia (observation, value, category, class)

MITTA-ASTEIKOISTA Mittaluvut voivat esittää erilaisia ominaisuuksia muuttujan luonteesta riippuen, ja muuttujien arvoihin liittyvää informaatiota voidaan käsitellä matemaattisesti eri tavoin Jokaisella muuttujalla on mitta-asteikko, jonka perusteella voidaan määritellä sille sopivat analyysimenetelmät Muuttuja on jatkuva, jos se voi saada minkä tahansa reaalilukuarvon tietyllä välillä, esim. pituus Muuttuja on epäjatkuva(diskreetti), jos se voi saada vain äärellisen määrän arvoja tietyllä välillä, esim. (biologinen) sukupuoli

MITTA-ASTEIKKOJA(EPÄJATKUVAT) Luokittelu- eli nominaaliasteikko Yksinkertaisin mittaustapa, jossa havainnot luokitellaan ennalta määriteltyihin luokkiin. Luokkien välillä ei vallitse järjestystä. Mittaluvuilla korvataan luokkien nimet. Esim. sukupuoli, siviilisääty. Informaatiosisältö: samanlaisuus/erilaisuus Järjestys- eli ordinaaliasteikko Luokitteluasteikkoa monimuotoisempi, sillä luokat voidaan asettaa järjestykseen mitattavan ominaisuuden suhteen. Luokat eivät välttämättä sijaitse samalla etäisyydellä toisistaan. Esim. koulutusaste. Informaatiosisältö: samanlaisuus/erilaisuus + järjestys

MITTA-ASTEIKKOJA(JATKUVAT) Välimatka- eli intervalliasteikko Havaintoyksiköillä on yksikäsitteinen järjestys ja muuttujan arvojen lisäykset voidaan laskea, mutta nolla ei ole asteikon minimikohta. Esim. lämpötila Celsius-asteikolla. Informaatiosisältö: samanlaisuus/erilaisuus, järjestys, välimatka Suhdeasteikko Suhdeasteikolla on välimatka-asteikollisen muuttujan ominaisuudet, mutta lisäksi myös nolla kohta, joka on minimi (ts. ominaisuus häviää absoluuttisessa nollakohdassa). Esim. pituus. Informaatiosisältö: samanlaisuus/erilaisuus, järjestys, välimatka, absoluuttinen nollakohta

MITTA-ASTEIKKOJA(ERIKOISTAPAUKSIA) Kaksiluokkainen muuttuja Muuttujalla on vain kaksi arvoluokkaa. Esim. on kroonisia sairauksia vs. ei ole kroonisia sairauksia. Diskreetit suhdeasteikolliset muuttujat Lukumäärämuuttujat (mm. Poisson). Esim. kroonisten sairauksien lukumäärä.

ESIMERKKEJÄ Mitta-asteikon määrittäminen: Usein helppoa mittareille, jotka mittaavat ominaisuutta suoraan: Pituus Paino Oletteko tupakoinut viimeisen vuoden aikana? Kyllä / ei Hankalampaa epäsuorilla mittareilla: CES-D: masentuneisuuden oirekyselyn summapistemäärä Järjestys- vai intervalliasteikko?

MUUTTUJAN INFORMAATIO Käytännössä pyritään siihen, että tarkasteltavaa ominaisuutta kuvaavat muuttujat pitäisivät sisällään mahdollisimman paljon informaatiota tutkimuskohteesta Objektiivisuus vs. tutkittavan oma arvio Jatkuvat muuttujat Enemmän informaatiota tarkemmat johtopäätökset Vrt. esim. pituuden mittaus Yli/alle 170 cm Yli 140 / 170 / 180 cm välein Mittaluokat täsmälleen 1 cm välein

CES-D Masentuneisuuden oirekysely 1. OLIN LEVOTON ASIOISTA, JOISTA EN YLEENSÄ HUOLESTU 2. MINUN EI TEHNYT MIELI SYÖDÄ; RUOKAHALUNI OLI HUONO HARVOIN TAI EI KOSKAAN JOSKUS MELKO USEIN LÄHES KOKO AJAN 3. TUNSIN ITSENI ALAKULOISEKSI PERHEENI JA YSTÄVIENI TUESTA HUOLIMATTA 4. MINUSTA TUNTUI, ETTÄ OLIN AIVAN YHTÄ HYVÄ IHMINEN KUIN MUUTKIN 5. MINULLA OLI VAIKEUKSIA KESKITTYÄ TEKEMISIINI 6. TUNSIN ITSENI MASENTUNEEKSI 7. KAIKKI MITÄ TEIN TUNTUI VAIVALLOISELTA 8. TULEVAISUUS TUNTUI TOIVEIKKAALTA : : : : : :

CES-D Masentuneisuuden oirekysely Vastaaja 1. OLIN LEVOTON ASIOISTA, JOISTA EN YLEENSÄ HUOLESTU 2. MINUN EI TEHNYT MIELI SYÖDÄ; RUOKAHALUNI OLI HUONO 3. TUNSIN ITSENI ALAKULOISEKSI PERHEENI JA YSTÄVIENI TUESTA HUOLIMATTA HARVOIN TAI EI KOSKAAN JOSKUS MELKO USEIN LÄHES KOKO AJAN 4. MINUSTA TUNTUI, ETTÄ OLIN AIVAN YHTÄ HYVÄ IHMINEN KUIN MUUTKIN 5. MINULLA OLI VAIKEUKSIA KESKITTYÄ TEKEMISIINI 6. TUNSIN ITSENI MASENTUNEEKSI 7. KAIKKI MITÄ TEIN TUNTUI VAIVALLOISELTA 8. TULEVAISUUS TUNTUI TOIVEIKKAALTA : : : : : :

CES-D Masentuneisuuden oirekysely Koodaaja 1. OLIN LEVOTON ASIOISTA, JOISTA EN YLEENSÄ HUOLESTU 2. MINUN EI TEHNYT MIELI SYÖDÄ; RUOKAHALUNI OLI HUONO 3. TUNSIN ITSENI ALAKULOISEKSI PERHEENI JA YSTÄVIENI TUESTA HUOLIMATTA HARVOIN TAI EI KOSKAAN JOSKUS MELKO USEIN LÄHES KOKO AJAN 0 2 1 Käänteinen 4. MINUSTA TUNTUI, ETTÄ OLIN AIVAN YHTÄ HYVÄ IHMINEN KUIN MUUTKIN 5. MINULLA OLI VAIKEUKSIA KESKITTYÄ TEKEMISIINI 0 1 Käänteinen 6. TUNSIN ITSENI MASENTUNEEKSI 7. KAIKKI MITÄ TEIN TUNTUI VAIVALLOISELTA 8. TULEVAISUUS TUNTUI TOIVEIKKAALTA 0 0 2 : : : : : :

MITTAVIRHE Mittausmenetelmien epätarkkuus Monia psyykkisiä ominaisuuksia mitataan asteikoilla, joissa kiinnostuksen kohteena olevaa ominaisuutta (esim. masentuneisuuden taso) ei voi tarkkaan erottaa muista vastaavanlaisista ominaisuuksista (mm. sulkeutuneisuus, yksinäisyys) Mittausvälineiden epätarkkuus Itse mittari saattaa olla sellainen, että se ei anna tarpeeksi tarkkoja lukuarvoja ominaisuudesta Mittaajan epätäsmällisyys Miten tarkasti mittaaja saa selville tutkittavan ominaisuuden lukuarvon Ympäristön häiriötekijät

AINEISTON KERÄÄMINEN Tärkein vaihe tutkimuksen tekemisessä, koska mitatessa tulleita virheitä ei välttämättä voi huomata eikä niitä usein voi korjata analyysivaiheessa. Mittaajan tulisi pyrkiä siihen, että mittaluvut saadaan selville ilman vääristymiä (käytännössä usein vaikeaa). Jos käytetään useampaa mittaajaa, pitäisi pyrkiä siihen, että mittaustulokset eivät riipu siitä, ketä käytetään mittaajana. Poikkeavat havainnot: pyritään jo mitattaessa selvittämään syitä sellaisille mittauksille, jossa mittaluku poikkeaa selkeästi muiden tutkittavien mittaluvuista

Ei ole perusjoukon määrittävää ominaisuutta On perusjoukon määrittävä ominaisuus Alkio Havaintoyksikkö Perusjoukko Otanta Otos Valikointi Näyte Kokonaistutkimus: tutkimus kattaa koko perusjoukon Otantatutkimus: tutkimus kattaa (edustavan) osan perusjoukkoa

OTANTA Kokonaistutkimus kuluttaa usein liikkaa resursseja (aikaa ja rahaa) ja on tehotonta, jos samoihin tuloksiin päästäisiin tutkimalla pienempi osa perusjoukkoa (otos). Tällöin voidaan harkita otantatutkimuksen tekemistä. Tavoitteena on, että otantatutkimuksella saadut tulokset olisivat samansuuntaiset kuin tulokset, jotka olisi saatu tutkimalla koko perusjoukko. Kun tutkittavat on poimittu otokseen otantamenetelmällä, tulokset ovat yleistettävissä perusjoukkoon. Satunnaistamisella pyritään siihen, että suhteellisen homogeenisen perusjoukon kaikilla alkioilla olisi yhtä suuri mahdollisuus päätyä otokseen kun satunnaisuus onnistuu, perusjoukon alkiot ovat oikeassa suhteessa edustettuina otoksessa Yleistettävyys pätee mm. toistetuille satunnaisotoksille (ns. frekvenssitulkinta).

OTANTA Käytännössä otantaa varten muodostetaan otantakehys (engl. samplingframe), josta otos poimitaan jotain otantamenetelmää käyttäen. Kehyksen voi muodostaa esim. jokin rekisteri tai luettelo. Otantamenetelmä valitaan perusjoukon homogeenisuuden mukaan Suhteellisen homogeeninen perusjoukko: yksinkertainen satunnaisotanta tai systemaattinen otanta Perusjoukossa on homogeenisia ryhmiä: ositettu otanta tai ryväsotanta Otantaa voidaan tehostaa lisäinformaation avulla Tässä käsittelemme aineistoja, joissa oletetaan käytetyn yksinkertaista satunnaisotantaa

OTOSKOKO Otoskoon määrittämiselle ei yksiselitteistä ohjetta, koska muuttujien informaatio, perusjoukot ja tutkimustilanteet ovat erilaisia. Vaaligallupit (Suomi): n = 1000 Yrityksen imagotutkimus (tietty alue): n= 150 300 Lääketieteellinen koe (koe-/kontrolliryhmä): n = 20 30 Jos tutkittavasta ilmiöstä on aikaisempaa tutkimustietoa, sopiva otoskoko voidaan määrittää matemaattisesti käyttämällä muuttujan arvojen arvioitua hajontaa ja tarkkuutta, jolla tutkimuskysymyksen tulos halutaan saada selville. Jotta tulokset olisivat luotettavia, pitää otoskoon olla sitä suurempi, mitä heterogeenisempi perusjoukko on.

YKSINKERTAINEN SATUNNAISOTANTA (YSO) 1. Määritetään otantakehys (N = 10) 1 2 3 4 5 6 7 8 9 10 2. Määritetään otoskoko n= 3 3. Valitaan otoskoon edellyttämä määrä satunnaislukuja 2 5 8 4. Poimitaan otokseen satunnaislukujen edustamat tutkittavat. 2 5 8

OTOSTAMISEEN LIITTYVIÄ ONGELMIA Otosmisenongelmat liittyvä satunnaistamisen epäonnistumiseen Suurimpia ongelmia ovat kato ja harha Kadon ja harhan vaikutukset voivat olla haitallisia analyysitulosten kannalta

KATO(ATTRITION, MISSING DATA) Kun otostetuistahavaintoyksiköistä saavutetaan (mitataan) vain osa, tarkoittaa kato sitä osaa tutkittavista tai mittauksista, jota ei saavutettu (mitattu). Teknisestä syystä kato on ongelmallista, koska se usein johtaa siihen, että havaintoyksikön muu mitattu aineisto joudutaan jättämään huomioimatta tai puuttuvien havaintoarvojen tilalle joudutaan tuottamaan arvioita näistä arvoista (imputointi) Jos puuttuvia havaintoja esiintyy satunnaisesti aineistossa, otoksesta saatavien tulosten ei pitäisi oleellisesti vääristyä käytössä on vain pienempi otos Tässä tapauksessa informaation puuttumisen sanotaan olevan vaikutuksetonta(non-informative) tutkimuksen tulosten suhteen. Jos kato on vaikutuksellista(informative), puuttuu aineistosta tällöin sellaisia havaintoja, joilla olisi vaikutusta tuloksiin. Tällöin puuttuvien havaintojen vaikutusta tuloksiin on yleensä vaikeampi arvioida.

KATO Katoa voidaan pyrkiä estämään erilaisin keinoin, esim. kyselyä suunniteltaessa: kysely laaditaan sopivan mittaiseksi: liian pitkä kysely ei motivoi tutkittavia kyselyyn osallistuvia voidaan motivoida sopivin keinoin (mm. luvataan palautetta tutkimuksen valmistuttua) valvotussa tilanteessa tulee antaa tarpeeksi aikaa vastata Jos kato on suurta ja resurssit sen sallivat, voi harkita uusintakyselyn suorittamista Tarkastellaan kadon vaikutusta tuloksiin myöhemmin tilastollisten tunnuslukujen yhteydessä

TUTKITTAVIEN LUKUMÄÄRIÄ KOSKEVIA TUNNUSLUKUJA Tutkimuksen kannalta keskeisiä kokoja ovat Perusjoukon koko Äärellinen / pieni; ääretön suuri Määritetään tutkimuskysymyksen pohjalta Otoksen koko pyritään optimaaliseen kokoon suhteessa perusjoukkoon ja tutkimuskysymykseen Vastausprosentti pyritään mahdollisimman pieneen katoon

HARHA(BIAS) Tutkimuksen tulokset ovat harhaisia silloin, kun otoksesta saatavat tiedon ovat systemaattisesti vääristyneitä suhteessa perusjoukon tuloksiin Usein kun satunnaistaminen epäonnistuu, tuloksiin liittyy harhaa. Valikointi Otoksesta puuttuu oleellisia ryhmiä Tärkeiden muuttujien puuttuminen Esim. kun tarkastellaan polvenojennusvoiman ja kehon rasvattoman painon välistä suhdetta ilman, että tunnetaan tutkittavien sukupuolta, tulokset kertovat usein enemmän sukupuolten eroista kuin em. muuttujien välisestä suhteesta Harhan tilanteessa kaikilla tutkittavilla ei ole ollut samaa todennäköisyyttä päätyä tutkimukseen Havaittua harhaa voi korjata esim. käyttämällä painokertoimia