TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Samankaltaiset tiedostot
TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI LTKY012. Timo Törmäkangas

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

Johdatus tilastotieteeseen Tilastollisten aineistojen kerääminen ja mittaaminen. TKK (c) Ilkka Mellin (2004) 1

Johdatus tilastotieteeseen Tilastollisten aineistojen kerääminen ja mittaaminen. TKK (c) Ilkka Mellin (2005) 1

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Tilastollisten aineistojen kerääminen ja mittaaminen

Populaatio tutkimusobjektien muodostama joukko, johon tilastollinen tutkimus kohdistuu, koko N

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Tilastollisten aineistojen kerääminen ja mittaaminen. Tilastollisten aineistojen kerääminen ja mittaaminen

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Sovellettu todennäköisyyslaskenta B

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

Tehtävä 1. Hypoteesi: Liikuntaneuvonta on hyvä keino vaikuttaa terveydentilaan. Onko edellinen hypoteesi hyvä tutkimushypoteesi? Kyllä.

Otannasta ja mittaamisesta

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI. LTKY012 Timo Törmäkangas Gerontologian tutkimuskeskus

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Mittaaminen menettely (sääntö), jolla tilastoyksikköön liitetään tiettyä ominaisuutta kuvaava luku, mittaluku.

1. Johdanto Todennäköisyysotanta Yksinkertainen satunnaisotanta Ositettu otanta Systemaattinen otanta...

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1

Harjoitus 7: NCSS - Tilastollinen analyysi

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

Mat Tilastollisen analyysin perusteet, kevät 2007

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1

pitkittäisaineistoissa

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

Väliestimointi (jatkoa) Heliövaara 1

ABHELSINKI UNIVERSITY OF TECHNOLOGY

Ohjeita kvantitatiiviseen tutkimukseen

pitkittäisaineistoissa

MONISTE 2 Kirjoittanut Elina Katainen

Testit laatueroasteikollisille muuttujille

Kvantitatiivisen aineiston analyysi

Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Tilastollisen tutkimuksen vaiheet

HAVAITUT JA ODOTETUT FREKVENSSIT

Tilastotieteen kertaus. Kuusinen/Heliövaara 1

Sovellettu todennäköisyyslaskenta B

Luentotesti 3. Kun tutkimuksen kävelynopeustietoja analysoidaan, onko näiden tutkittavien aiheuttama kato

MTTTP1 Tilastotieteen johdantokurssi Luento JOHDANTO

r = n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit.

tilastotieteen kertaus

Kandidaatintutkielman aineistonhankinta ja analyysi

Luentokalvoja tilastollisesta päättelystä. Kalvot laatinut Aki Taanila Päivitetty

Kvantitatiiviset menetelmät

Monitasomallit koulututkimuksessa

Testejä suhdeasteikollisille muuttujille

Yhteistyöaineiden edustajan puheenvuoro

b6) samaan perusjoukkoon kohdistuu samanaikaisesti useampia tutkimuksia.

Matemaatikot ja tilastotieteilijät

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Harjoitus 2: Matlab - Statistical Toolbox

Teema 8: Parametrien estimointi ja luottamusvälit

Kliininen arviointi ja kliininen tieto mikä riittää?

Poimi yrityksistä i) neljän, ii) kymmenen suuruinen otos. a) yksinkertaisella satunnaisotannalla palauttaen, b) systemaattisella otannalla

Tekijä(t) Vuosi Nro. Arviointikriteeri K E? NA

Ohjeita kvantitatiiviseen tutkimukseen

Ohjeita kvantitatiiviseen tutkimukseen

Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi

Lohkoasetelmat. Vilkkumaa / Kuusinen 1

Hannu mies LTK 180 Johanna nainen HuTK 168 Laura nainen LuTK 173 Jere mies NA 173 Riitta nainen LTK 164

1. Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet

Mitä tarvitsee tietää biostatistiikasta ja miksi? Matti Uhari Lastentautien klinikka Oulun yliopisto

Osa 2: Otokset, otosjakaumat ja estimointi

Sovellettu todennäköisyyslaskenta B

Mat Tilastollisen analyysin perusteet, kevät 2007

Sovellettu todennäköisyyslaskenta B

Til.yks. x y z

Johdatus tilastotieteeseen Tilastolliset testit. TKK (c) Ilkka Mellin (2005) 1

Testit järjestysasteikollisille muuttujille

KURSSIKYSELYAINEISTO: HUOM! Aineiston tilastoyksikkömäärä 11 on kovin pieni oikean tilastotieteen tekemiseen, mutta Harjoitteluun se kelpaa kyllä!

KVANTITATIIVINEN TUTKIMUS

¼ ¼ joten tulokset ovat muuttuneet ja nimenomaan huontontuneet eivätkä tulleet paremmiksi.

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi. Viikko 5

pisteet Frekvenssi frekvenssi Yhteensä

1.Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu

LIITE 1 VIRHEEN ARVIOINNISTA

Aineistokoko ja voima-analyysi

Sovellettu todennäköisyyslaskenta B

Metsämuuronen: Tilastollisen kuvauksen perusteet ESIPUHE... 4 SISÄLLYSLUETTELO METODOLOGIAN PERUSTEIDEN KERTAUSTA AINEISTO...

LIITE 1 VIRHEEN ARVIOINNISTA

Jos nollahypoteesi pitää paikkansa on F-testisuuren jakautunut Fisherin F-jakauman mukaan

Tilastolliset testit. Tilastolliset testit. Tilastolliset testit: Mitä opimme? 2/5. Tilastolliset testit: Mitä opimme? 1/5

LIITE 1 VIRHEEN ARVIOINNISTA

Transkriptio:

TUTKIMUSAINEISTON ANALYYSI LTKY012 Timo Törmäkangas

KURSSIN SISÄLTÖ Johdanto Mittaaminen ja aineiston hankinta Mitta-asteikot Otanta Aineiston esittäminen ja data-analyysi Havaintomatriisi Yksiulotteisen empiirisen jakauman esittäminen Frekvenssijakauma Luokittelu Kuviot Tunnusluvut Kaksiulotteisen jakauman esittäminen ja riippuvuus Ristiintaulukko ja kuviot Riippuvuuden tunnusluvut Vähän todennäköisyydestä Otantajakauma Tilastollinen päätöksenteko Estimointi Hypoteesien testaus Perustestejä Keskiarvotestit, varianssianalyysit Riippuvuuden testit

KVANTITATIIVISEN TUTKIMUKSEN VAIHEET(EI VALMISTA AINEISTOA) 1. Tutkimusongelman määrittäminen Kirjallisuuteen perehtyminen 2. Suunnitteluvaihe Ongelman yksityiskohtaisempi määrittely Teorian valinta ja hypoteesien laadinta Konkretisointi Mittareiden ja menetelmien valinta Aineiston keruun suunnittelu Analyysin suunnittelu Raportoinnin suunnittelu 3. Kenttätyövaihe eli aineiston keruu 4. Tietojen tallennus ja muokkaus analyysia varten 5. Tietojen analysointi ja johtopäätösten teko 6. Tutkimuksen raportointi

TUTKIMUSKYSYMYS Tutkimus lähtee liikkeelle siitä, että halutaan tarkastella jotakin todellisuuden ilmiötä ja tarkastelu puetaan usein kysymyksen muotoon Esim. Onko fyysisellä aktiivisuudella vaikutusta riskiin sairastua flunssaan? Tutkimuskysymyksestä muodostetaan tutkimushypoteesi, jossa otetaan kantaa siihen, mikä olisi mahdollinen vastaus tutkimuskysymykseen Mikä on tutkimushypoteesi, jos oletetaan, että vähäisempi aktiivisuus liittyy suurempaan riskiin? Tutkimushypoteeseistajohdetaan tilastollisen testauksen testaushypoteesit(näistä myöhemmin)

HYVÄ HYPOTEESI Esittää yksiselitteisen suhteen kahden tutkittavan asian välille On perusteltu (teoria tai muut syyt) On empiirisesti testattavissa On lyhytja selkeä Kvantitatiivisessa tutkimuksessa hypoteesilla on yleensä matemaattinen vastine Hypoteesi: r 0 > r 1, missä ron sairastumisriski, ja indeksi 0 = matalaa fyysisen aktiivisuuden taso ja 1 = korkea fyysisen aktiivisuuden taso

KURSSIN SISÄLTÖ Johdanto Mittaaminen ja aineiston hankinta Mitta-asteikot Otanta Aineiston esittäminen ja data-analyysi Havaintomatriisi Yksiulotteisen empiirisen jakauman esittäminen Frekvenssijakauma Luokittelu Kuviot Tunnusluvut Kaksiulotteisen jakauman esittäminen ja riippuvuus Ristiintaulukko ja kuviot Riippuvuuden tunnusluvut Vähän todennäköisyydestä Otantajakauma Tilastollinen päätöksenteko Estimointi Hypoteesien testaus Perustestejä Keskiarvotestit, varianssianalyysit Riippuvuuden testit

TEOREETTINEN MALLI JA MITTAAMINEN Kvantitatiiviseen tutkimusotteeseen kuuluu, että tarkasteltavasta ilmiöstä luodaan malli Malliin kuuluvat tutkimusobjektit Tutkimusobjektien ominaisuudetmääritellään teoreettisilla termeillä Termitkäännetään empiirisiksikvantitatiivista tutkimusta varten Jokaiseen termiin liitetään mittaoperaatio Ominaisuuttasaadaan näin kuvaamaan lukuarvo, mittaluku(mittaoperaatio) Mittaaminen on toimenpide, jolla tutkimusobjektiin liitetään jotain sen ominaisuutta kuvaava luku eli mittaluku

MITTAAMISEN KÄSITTEITÄ Mittaoperaation säännöt ja välineet = mittari Objekti, jolle mittaus suoritetaan on havaintoyksikkö, tapaus, tutkittava(case) Ominaisuus, jota mitataan on muuttuja(variable) Ominaisuus voi saada erilaisia lukuarvoja, jotka ovat muuttujan havaintoarvojatai luokkia (observation, value, category, class) Lukuarvot kuvaavat mitattavan ominaisuuden suurempaa määrällistä esiintyvyyttä Esim. suuret lukuarvot fyysisen aktiivisuuden mittarissa kertovat aktiivisemmasta fyysistä harrastuneisuudesta kielteisen asenteen mittarissa kertovat kielteisemmästä asenteesta

MITTA-ASTEIKOISTA Mittaluvut voivat esittää erilaisia ominaisuuksia muuttujan luonteesta riippuen, ja muuttujien arvoihin liittyvää informaatiota voidaan käsitellä matemaattisesti eri tavoin Jokaisella muuttujalla on mitta-asteikko, jonka perusteella voidaan määritellä sille sopivat analyysimenetelmät Muuttuja on epäjatkuva(diskreetti), jos se voi saada vain äärellisen määrän arvoja tietyllä välillä, esim. (biologinen) sukupuoli Muuttuja on jatkuva, jos se voi saada minkä tahansa reaalilukuarvon tietyllä välillä, esim. pituus

MITTA-ASTEIKKOJA(EPÄJATKUVAT) Luokittelu- eli nominaaliasteikko Yksinkertaisin mittaustapa, jossa havainnot luokitellaan ennalta määriteltyihin luokkiin. Luokkien välillä ei vallitse järjestystä. Mittaluvuilla korvataan luokkien nimet. Esim. sukupuoli, siviilisääty. Informaatiosisältö: samanlaisuus/erilaisuus Järjestys- eli ordinaaliasteikko Luokitteluasteikkoa monimuotoisempi, sillä luokat voidaan asettaa järjestykseen mitattavan ominaisuuden suhteen. Luokat eivät välttämättä sijaitse samalla etäisyydellä toisistaan. Esim. koulutusaste. Informaatiosisältö: samanlaisuus/erilaisuus + järjestys

MITTA-ASTEIKKOJA(JATKUVAT) Välimatka- eli intervalliasteikko Havaintoyksiköillä on yksikäsitteinen järjestys ja muuttujan arvojen lisäykset voidaan laskea, mutta nolla ei ole asteikon minimikohta. Esim. lämpötila Celsius-asteikolla. Informaatiosisältö: samanlaisuus/erilaisuus, järjestys, välimatka Suhdeasteikko Suhdeasteikolla on välimatka-asteikollisen muuttujan ominaisuudet, mutta lisäksi myös nolla kohta, joka on minimi (ts. ominaisuus häviää absoluuttisessa nollakohdassa). Esim. pituus. Informaatiosisältö: samanlaisuus/erilaisuus, järjestys, välimatka, absoluuttinen nollakohta

MITTA-ASTEIKKOJA(ERIKOISTAPAUKSIA) Kaksiluokkainen muuttuja Muuttujalla on vain kaksi arvoluokkaa. Esim. on kroonisia sairauksia vs. ei ole kroonisia sairauksia. Diskreetit suhdeasteikolliset muuttujat Lukumäärämuuttujat (mm. Poisson). Esim. kroonisten sairauksien lukumäärä.

MITEN SELVITTÄÄ MITTA-ASTEIKKO? Yleensä on riittävää selvittää, onko muuttujan mitta-asteikko 1) luokitusasteikko, 2) järjestysasteikko, vai 3) jatkuva Voiko muuttuja saada vähän / paljon erilaisia arvoja? Jos voi, niin kyseessä on todennäköisesti jatkuva muuttuja (mutta huom. esim. ammatti) Voiko arvot laittaa järjestykseen? Jos ei voi, niin kyseessä on luokitusasteikollinen muuttuja

ESIMERKKEJÄ Mitta-asteikon määrittäminen: Usein helppoa mittareille, jotka mittaavat ominaisuutta suoraan: Pituus Paino Oletteko tupakoinut viimeisen vuoden aikana? Kyllä / ei Hankalampaa epäsuorilla mittareilla: CES-D: masentuneisuuden oirekyselyn summapistemäärä Järjestys- vai intervalliasteikko?

MUUTTUJAN INFORMAATIO Käytännössä pyritään siihen, että tarkasteltavaa ominaisuutta kuvaavat muuttujat pitäisivät sisällään mahdollisimman paljon informaatiota tutkimuskohteesta Objektiivisuus vs. tutkittavan oma arvio Jatkuvat muuttujat Enemmän informaatiota tarkemmat johtopäätökset Vrt. esim. pituuden mittaus Yli/alle 170 cm Luokat: vähintään 140 / 170 / 180 cm Mittaluokat täsmälleen 1 cm välein

Tutkittavat suorittavat 14 tehtävää

Tasapainotestin mittaustulos on sarakkeesta yhteenlaskettu pistemäärä. 3 4 4 4 4 3 4 2 3

CES-D Masentuneisuuden oirekysely 1. OLIN LEVOTON ASIOISTA, JOISTA EN YLEENSÄ HUOLESTU 2. MINUN EI TEHNYT MIELI SYÖDÄ; RUOKAHALUNI OLI HUONO HARVOIN TAI EI KOSKAAN JOSKUS MELKO USEIN LÄHES KOKO AJAN Tutkittava vastaa 20 kysymykseen 3. TUNSIN ITSENI ALAKULOISEKSI PERHEENI JA YSTÄVIENI TUESTA HUOLIMATTA 4. MINUSTA TUNTUI, ETTÄ OLIN AIVAN YHTÄ HYVÄ IHMINEN KUIN MUUTKIN 5. MINULLA OLI VAIKEUKSIA KESKITTYÄ TEKEMISIINI 6. TUNSIN ITSENI MASENTUNEEKSI 7. KAIKKI MITÄ TEIN TUNTUI VAIVALLOISELTA 8. TULEVAISUUS TUNTUI TOIVEIKKAALTA : : : : : :

CES-D Masentuneisuuden oirekysely 1. OLIN LEVOTON ASIOISTA, JOISTA EN YLEENSÄ HUOLESTU 2. MINUN EI TEHNYT MIELI SYÖDÄ; RUOKAHALUNI OLI HUONO HARVOIN TAI EI KOSKAAN JOSKUS MELKO USEIN LÄHES KOKO AJAN 3. TUNSIN ITSENI ALAKULOISEKSI PERHEENI JA YSTÄVIENI TUESTA HUOLIMATTA 4. MINUSTA TUNTUI, ETTÄ OLIN AIVAN YHTÄ HYVÄ IHMINEN KUIN MUUTKIN 5. MINULLA OLI VAIKEUKSIA KESKITTYÄ TEKEMISIINI 6. TUNSIN ITSENI MASENTUNEEKSI 7. KAIKKI MITÄ TEIN TUNTUI VAIVALLOISELTA 8. TULEVAISUUS TUNTUI TOIVEIKKAALTA : : : : : :

CES-D Masentuneisuuden oirekysely Koodaaja 1. OLIN LEVOTON ASIOISTA, JOISTA EN YLEENSÄ HUOLESTU 2. MINUN EI TEHNYT MIELI SYÖDÄ; RUOKAHALUNI OLI HUONO 3. TUNSIN ITSENI ALAKULOISEKSI PERHEENI JA YSTÄVIENI TUESTA HUOLIMATTA HARVOIN TAI EI KOSKAAN JOSKUS MELKO USEIN LÄHES KOKO AJAN 0 2 1 Käänteinen 4. MINUSTA TUNTUI, ETTÄ OLIN AIVAN YHTÄ HYVÄ IHMINEN KUIN MUUTKIN 5. MINULLA OLI VAIKEUKSIA KESKITTYÄ TEKEMISIINI 0 1 Käänteinen 6. TUNSIN ITSENI MASENTUNEEKSI 7. KAIKKI MITÄ TEIN TUNTUI VAIVALLOISELTA 8. TULEVAISUUS TUNTUI TOIVEIKKAALTA 0 0 2 : : : : : :

CES-D CES-D mittarin yhteenlaskettua pistemäärää vaihtelee välillä 0 60 Sitä käytetään tunnuslukuna, joka kertoo masentuneisuusoireiden vakavuudesta CES-D ja Bergin tasapainotesti ovat masentuneisuuteen taipuvuuden ja tasapainon epäsuoria mittareita Mikä on näiden mittarien mitta-asteikko? Samankaltaisia asteikkoihin perustuvia epäsuoria mittareita käytetään paljon terveystieteissä: UCLA yksinäisyys, liikuntamotivaatio (REMM), WHO-elämänlaatu, COPE (omaishoidon tuki), BDI (masentuneisuus)

MITTAVIRHE Mittausmenetelmien epätarkkuus Monia psyykkisiä ominaisuuksia mitataan asteikoilla, joissa kiinnostuksen kohteena olevaa ominaisuutta (esim. masentuneisuuden taso) ei voi tarkkaan erottaa muista vastaavanlaisista ominaisuuksista (mm. sulkeutuneisuus, yksinäisyys) Mittausvälineiden epätarkkuus Itse mittari saattaa olla sellainen, että se ei anna tarpeeksi tarkkoja lukuarvoja ominaisuudesta Mittaajan epätäsmällisyys Keskittymisen herpaantuminen Ympäristön häiriötekijät Erilaiset tekijät, jotka eivät ole osa tutkimusta Mitattavan epätäsmällisyys Ymmärrettiinkö oikein mitä kysytään?

Marko: Aineisto: Kolme muuttujaa: Tutkimuskysymys: Kaksi ryhmää (koe ja kontrolli) Kävelynopeus (metri/sekunti) Polven ojennusvoima (Newton) Bergin tasapainotesti (summapistemäärä) 1)Onko ryhmien keskiarvoissa eroa perusjoukossa? 2)Onko keskiarvoeroja itse arvioidun terveyden suhteen (hyvä / keskinkertainen / huono). Sari: Aineisto: Ryhmä naisia Kolme muuttujaa: Kehon painoindeksi (kg/m 2 ) Fyysinen aktiivisuus (MET, energiankulutus suhteessa lepotilaan) Kävelynopeus (m/s) Tutkimuskysymys: Onko painoindeksi riippuvainen fyysisen aktiivisuuden määrästä ja / tai kävelynopeudesta? Elina: Aineisto: Kaksi muuttujaa: Tutkimuskysymys: Ryhmä satunnaisesti valittuja viidesluokkalaisia kolmesta koulusta Ruokavalio (vähärasvainen, vähälaktoosinen, normaali) Itse arvioitu terveys (hyvä / keskinkertainen / huono). Riippuuko oma arvio terveyden tilasta ruokavaliosta? Mitä muuttujien mitta-asteikkoja havaitset Markon, Sarin ja Elinan tutkimuksissa?

AINEISTON KERÄÄMINEN Tärkein vaihe tutkimuksen tekemisessä, koska mitatessa tulleita virheitä ei välttämättä voi huomata eikä niitä usein voi korjata analyysivaiheessa. Mittaajan tulisi pyrkiä siihen, että mittaluvut saadaan selville ilman vääristymiä (käytännössä usein vaikeaa). Jos käytetään useampaa mittaajaa, pitäisi pyrkiä siihen, että mittaustulokset eivät riipu siitä, ketä käytetään mittaajana. Poikkeavat havainnot: pyritään jo mitattaessa selvittämään syitä sellaisille mittauksille, joissa havaittu mittaluku poikkeaa selkeästi muiden tutkittavien mittaluvuista

Ei ole perusjoukon määrittävää ominaisuutta On perusjoukon määrittävä ominaisuus Alkio Havaintoyksikkö Perusjoukko Otanta Otos Valikointi Näyte Kokonaistutkimus: tutkimus kattaa koko perusjoukon Otantatutkimus: tutkimus kattaa (edustavan) osan perusjoukkoa

OTANTA Kokonaistutkimus kuluttaa usein liikkaa resursseja (aikaa ja rahaa) ja on tehotonta, jos samoihin tuloksiin päästäisiin tutkimalla pienempi osa perusjoukkoa (otos). Tällöin voidaan harkita otantatutkimuksen tekemistä. Tavoitteena on, että otantatutkimuksella saadut tulokset olisivat samansuuntaiset kuin tulokset, jotka olisi saatu tutkimalla koko perusjoukko. Kun tutkittavat on poimittu otokseen otantamenetelmällä, tulokset ovat yleistettävissä perusjoukkoon. Satunnaistamisella pyritään siihen, että suhteellisen homogeenisen perusjoukon kaikilla alkioilla olisi yhtä suuri mahdollisuus päätyä otokseen kun satunnaisuus onnistuu, perusjoukon alkiot ovat oikeassa suhteessa edustettuina otoksessa ja matemaattisten menetelmien käyttö analyysissä on järkevää Yleistettävyys pätee mm. toistetuille satunnaisotoksille (ns. frekvenssitulkinta).

OTANTA Käytännössä otantaa varten muodostetaan otantakehys (engl. sampling frame), josta otos poimitaan jotain otantamenetelmää käyttäen. Kehyksen voi muodostaa esim. jokin rekisteri tai luettelo. Sopiva otantamenetelmä valitaan perusjoukon homogeenisuuden mukaan Suhteellisen homogeeninen perusjoukko: yksinkertainen satunnaisotanta tai systemaattinen otanta Perusjoukossa on homogeenisia ryhmiä: ositettu otanta tai ryväsotanta Tässä käsittelemme aineistoja, joissa oletetaan käytetyn yksinkertaista satunnaisotantaa

OTOSKOKO Otoskoon määrittämiselle ei yksiselitteistä ohjetta, koska muuttujien informaatio, perusjoukot ja tutkimustilanteet ovat erilaisia. Vaaligallupit (Suomi): n = 1000 Yrityksen imagotutkimus (tietty alue): n= 150 300 Lääketieteellinen koe (koe-/kontrolliryhmä): n = 20 30 Jos tutkittavasta ilmiöstä on aikaisempaa tutkimustietoa, sopiva otoskoko voidaan määrittää matemaattisesti (eri menetelmille erilaiset laskukaavat) Vaikutuksen koko (effect size) Muuttujiin liittyvä hajonta ja yhteishajonta Merkitsevyystaso (significance level) Tehokkuus (power) Kokeellisessa asetelmassa testattaessa useampaa muuttujaa samanaikaisesti pitää muuttujien lukumäärä ottaa huomioon Jotta tulokset olisivat luotettavia, pitää otoskoon olla sitä suurempi, mitä heterogeenisempi perusjoukko on.

Marko: Aineisto: Kolme muuttujaa: Tutkimuskysymys: Kaksi ryhmää (koe ja kontrolli), liikuntainterventio Kävelynopeus (metri/sekunti) Polven ojennusvoima (Newton) Bergin tasapainotesti (summapistemäärä) 1)Onko ryhmien keskiarvoissa eroa perusjoukossa? 2)Onko keskiarvoeroja itse arvioidun terveyden suhteen (hyvä / keskinkertainen / huono). Sari: Aineisto: Ryhmä naisia, tutkimus on osa geneettistä analyysia Kolme muuttujaa: Kehon painoindeksi (kg/m 2 ) Fyysinen aktiivisuus (MET, energiankulutus suhteessa lepotilaan) Kävelynopeus (m/s) Tutkimuskysymys: Onko painoindeksi riippuvainen fyysisen aktiivisuuden määrästä ja / tai kävelynopeudesta? Elina: Aineisto: Kaksi muuttujaa: Tutkimuskysymys: Ryhmä satunnaisesti valittuja viidesluokkalaisia kolmesta koulusta Ruokavalio (vähärasvainen, vähälaktoosinen, normaali) Itse arvioitu terveys (hyvä / keskinkertainen / huono). Riippuuko oma arvio terveyden tilasta ruokavaliosta? Mikä voisi olla perusjoukko Markon, Sarin ja Elinan tutkimuksissa? Mikä voisi olla sopiva otoskoko kullekin tutkimukselle?

YKSINKERTAINEN SATUNNAISOTANTA (YSO) 1. Määritetään otantakehys (N = 10) 1 2 3 4 5 6 7 8 9 10 2. Määritetään otoskoko n= 3 3. Valitaan otoskoon edellyttämä määrä satunnaislukuja 2 5 8 4. Poimitaan otokseen satunnaislukujen edustamat tutkittavat. 2 5 8

KATO(ATTRITION, MISSING DATA) Kun otostetuistahavaintoyksiköistä saavutetaan (mitataan) vain osa, tarkoittaa kato sitä osaa tutkittavista tai mittauksista, jota ei saavutettu (mitattu). Teknisestä syystä kato on ongelmallista, koska se usein johtaa siihen, että havaintoyksikön muu mitattu aineisto joudutaan jättämään huomioimatta tai puuttuvien havaintoarvojen tilalle joudutaan tuottamaan arvioita havaitsematta jääneistä arvoista (imputointi) Jos puuttuvia havaintoja esiintyy satunnaisesti aineistossa, otoksesta saatavien tulosten ei pitäisi oleellisesti vääristyä käytössä on vain pienempi otos Jos puuttuva tieto ei vääristä tutkimustuloksia, informaation puuttumisen sanotaan olevan vaikutuksetonta(noninformative) tutkimuksen tulosten suhteen. Jos kato on vaikutuksellista(informative), puuttuu aineistosta tällöin sellaisia havaintoja, joilla olisi vaikutusta tuloksiin. Tällöin puuttuvien havaintojen vaikutusta tuloksiin on yleensä vaikeampi arvioida.

KATO Katoa voidaan pyrkiä estämään erilaisin keinoin, esim. kyselyä suunniteltaessa: kysely laaditaan sopivan mittaiseksi: liian pitkä kysely ei motivoi tutkittavia kyselyyn osallistuvia voidaan motivoida sopivin keinoin (mm. luvataan palautetta tutkimuksen valmistuttua) valvotussa tilanteessa tulee antaa tarpeeksi aikaa vastata Jos kato on suurta ja resurssit sen sallivat, voi harkita uusintakyselyn suorittamista Tarkastellaan kadon vaikutusta tuloksiin myöhemmin tilastollisten tunnuslukujen yhteydessä

HARHA(BIAS) Tutkimuksen tulokset ovat harhaisia silloin, kun otoksesta saatavat tiedon ovat systemaattisesti vääristyneitä suhteessa perusjoukon tuloksiin Usein kun satunnaistaminen epäonnistuu, tuloksiin liittyy harhaa. Valikointi Otoksesta puuttuu oleellisia ryhmiä Tärkeiden muuttujien puuttuminen Esim. kun tarkastellaan polvenojennusvoiman ja kehon rasvattoman painon välistä suhdetta ilman, että tunnetaan tutkittavien sukupuolta, tulokset kertovat usein enemmän sukupuolten eroista kuin em. muuttujien välisestä suhteesta Harhan tilanteessa kaikilla tutkittavilla ei ole ollut samaa todennäköisyyttä päätyä tutkimukseen Havaittua harhaa voi korjata esim. käyttämällä painokertoimia

TUTKITTAVIEN LUKUMÄÄRIÄ KOSKEVIA TUNNUSLUKUJA Tutkimuksen kannalta keskeisiä kokoja ovat Perusjoukon koko Äärellinen / pieni; ääretön suuri Määritetään tutkimuskysymyksen pohjalta Otoksen koko pyritään optimaaliseen kokoon suhteessa perusjoukkoon ja tutkimuskysymykseen Vastausprosentti pyritään mahdollisimman pieneen katoon