Otannasta ja mittaamisesta

Samankaltaiset tiedostot
Johdatus tilastotieteeseen Tilastollisten aineistojen kerääminen ja mittaaminen. TKK (c) Ilkka Mellin (2005) 1

Tilastollisten aineistojen kerääminen ja mittaaminen

Johdatus tilastotieteeseen Tilastollisten aineistojen kerääminen ja mittaaminen. TKK (c) Ilkka Mellin (2004) 1

Tilastollisten aineistojen kerääminen ja mittaaminen. Tilastollisten aineistojen kerääminen ja mittaaminen

Mittaaminen menettely (sääntö), jolla tilastoyksikköön liitetään tiettyä ominaisuutta kuvaava luku, mittaluku.

Populaatio tutkimusobjektien muodostama joukko, johon tilastollinen tutkimus kohdistuu, koko N

Sovellettu todennäköisyyslaskenta B

Ellei tutkijalla ole käsitystä mittauksensa validiteetista ja reliabiliteetista, ei johtopäätöksillä

MONISTE 2 Kirjoittanut Elina Katainen

Yleistetyistä lineaarisista malleista

Sovellettu todennäköisyyslaskenta B

Mittaamisen maailmasta muutamia asioita. Heli Valkeinen, erikoistutkija, TtT TOIMIA-verkoston koordinaattori

Kvantitatiiviset menetelmät

edellyttää valintaa takaisinpanolla Aritmeettinen keskiarvo Jos, ½ Ò muodostavat satunnaisotoksen :n jakaumasta niin Otosvarianssi Ë ¾

Kvantitatiivisen aineiston analyysi

Harjoitus 2: Matlab - Statistical Toolbox

Estimointi. Vilkkumaa / Kuusinen 1

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Mat Tilastollisen analyysin perusteet, kevät 2007

Teema 8: Parametrien estimointi ja luottamusvälit

Tilastotieteen kertaus. Kuusinen/Heliövaara 1

Tilastollinen aineisto Luottamusväli

Harjoitus 7: NCSS - Tilastollinen analyysi

Tutkimusasetelma, mittaaminen ja otanta

Osa 2: Otokset, otosjakaumat ja estimointi

Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi

tilastotieteen kertaus

Parametrin estimointi ja bootstrap-otanta

Regressioanalyysi. Vilkkumaa / Kuusinen 1

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

ABHELSINKI UNIVERSITY OF TECHNOLOGY

Väliestimointi (jatkoa) Heliövaara 1

Luento KERTAUSTA Kaksiulotteinen jakauma Pisteparvi, Toyota Avensis -farmariautoja

Regressioanalyysi. Kuusinen/Heliövaara 1

1. Tilastollinen malli??

Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit

Koetun hyvinvoinnin mittaaminen

pitkittäisaineistoissa

Ohjeita kvantitatiiviseen tutkimukseen

Monitasomallit koulututkimuksessa

Ohjeita kvantitatiiviseen tutkimukseen

pitkittäisaineistoissa

Tutkimustiedonhallinnan peruskurssi

Viestinnän mentelmät I: sisällön erittely. Sisällönanalyysi/sisällön erittely. Sisällön erittely. Juha Herkman

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

1. Miten kvantitatiivisen tutkimuksen luotettavuutta voidaan arvioida Paunosen ja Vehviläinen-Julkusen

Mittaamisen hyödyt. Heli Valkeinen, erikoistutkija, TtT TOIMIA-verkoston koordinaattori

Mat Sovelletun matematiikan erikoistyöt PSYKOLOGISTEN ILMIÖIDEN MITTAAMINEN. Auli Hämäläinen 48444R

ALKUSANAT... 4 ALKUSANAT E-KIRJA VERSIOON... 5 SISÄLLYSLUETTELO... 6

805306A Johdatus monimuuttujamenetelmiin, 5 op

Harjoitus 9: Excel - Tilastollinen analyysi

Sovellettu todennäköisyyslaskenta B

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 6. luento. Pertti Palo

Mittaustekniikka (3 op)

Viestinnän mentelmät I: sisällön erittely. Sisällönanalyysi/sisällön erittely. Sisällön erittely. Juha Herkman

Sisältö. Perusteiden Kertaus. Tilastollinen analyysi. Peruskäsitteitä. Peruskäsitteitä. Kvantitatiivinen metodologia verkossa

Testejä suhdeasteikollisille muuttujille

1. Johdanto Todennäköisyysotanta Yksinkertainen satunnaisotanta Ositettu otanta Systemaattinen otanta...

ABHELSINKI UNIVERSITY OF TECHNOLOGY

Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Luottamusvälit. Normaalijakauma johnkin kohtaan

Ohjeita kvantitatiiviseen tutkimukseen

KVANTITATIIVINEN TUTKIMUS

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

Tehtävät. 1. Ratkaistava epäyhtälöt. a) 2(4 x) < 12, b) 5(x 2 4x + 3) < 0, c) 3 2x 4 > 6. 1/10. Sukunimi (painokirjaimin)

l (φ; y) = l(θ(φ); y) Toinen derivaatta saadaan tulon derivaatan laskusäännöllä Uudelleenparametroidun mallin Fisherin informaatio on

Johdatus regressioanalyysiin. Heliövaara 1

TUTKIMUSAINEISTON ANALYYSI LTKY012. Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Tilastollisen analyysin perusteet Luento 9: Moniulotteinen lineaarinen. regressio

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Asteikoista ja segmentoinnista

Tekijä(t) Vuosi Nro. Arviointikriteeri K E? NA

pisteet Frekvenssi frekvenssi Yhteensä

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Testit järjestysasteikollisille muuttujille

Dynaamiset regressiomallit

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin

YKYY2 Yhteiskunnan mittaaminen Kertauskuulustelu

MTTTP1 Tilastotieteen johdantokurssi Luento JOHDANTO

MTTTP1, luento KERTAUSTA

Testit laatueroasteikollisille muuttujille

Kojemeteorologia. Sami Haapanala syksy Fysiikan laitos, Ilmakehätieteiden osasto

031021P Tilastomatematiikka (5 op) kertausta 2. vk:een

Socca. Pääkaupunkiseudunsosiaalialan osaamiskeskus. Vaikuttavuuden mittaaminen sosiaalihuollossa. Petteri Paasio FL, tutkija

Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt: Mitä opimme? Latinalaiset neliöt

MTTTP1, luento KERTAUSTA

Tilastollisia peruskäsitteitä ja Monte Carlo

Oletetaan, että virhetermit eivät korreloi toistensa eikä faktorin f kanssa. Toisin sanoen

2. luentokrt KOTITEHTÄVÄ: VASTAA UUDELLEEN KAHTEEN KYSYMYKSEESI TÄMÄN PÄIVÄN TIEDON PERUSTEELLA

Teema 3: Tilastollisia kuvia ja tunnuslukuja

7. Tutkimuksen teko. Kevät 2005 Empiirinen ohjelmistotutkimus / Taina. Kevät 2005 Empiirinen ohjelmistotutkimus / Taina

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Sovellettu todennäköisyyslaskenta B

Poimi yrityksistä i) neljän, ii) kymmenen suuruinen otos. a) yksinkertaisella satunnaisotannalla palauttaen, b) systemaattisella otannalla

Sovellettu todennäköisyyslaskenta B

Transkriptio:

Otannasta ja mittaamisesta Tilastotiede käytännön tutkimuksessa - kurssi, kesä 2001 Reijo Sund Aineistot Kvantitatiivisen tutkimuksen aineistoksi kelpaa periaatteessa kaikki havaintoihin perustuva informaatio, joka on mittauksen avulla muutettavissa numeeriseen muotoon Aineiston hankinta vaatii yleensä runsaasti käytännön työtä Huonosti toteutettu aineiston keruu estää johtopäätösten teon 1

Aineistotyyppejä Poikkileikkausaineisto Tietoja yhdeltä ajanhetkeltä tai aikaväliltä Paneeliaineisto Tietoja useilta ajanhetkiltä Tapahtumahistoria-aineisto Tietoja tapahtumahetkiltä Otantatutkimus Otantatutkimuksissa otos valitaan siitä populaatiosta, josta halutaan saada tietoja Perusoletuksena on otoksen yleistettävyys koko populaatioon Tilastollisen mallin parametrit estimoidaan käytettävissä olevan aineiston (otoksen) perusteella 2

Otanta-asetelmia Otos voidaan valita populaatiosta usealla eri tavalla Yksinkertainen satunnaisotanta Jokaisella tietyn kokoisella otoksella sama mahdollisuus tulla valituksi Ositettu otanta Populaatio jaetaan homogeenisiin ositteisiin, joista jokaisesta sitten poimitaan erillinen otos Moniasteinen otanta Hyödynnetään populaation hierarkkista jakoa Ongelmia otannassa (1/2) Poimintaharha otos ei edusta populaatiota Vaarana varsinkin silloin, kun otokseen tulleet populaation alkiot ovat valikoituneet tai ovat itse valinneet itsensä otokseen Vajaapeittävyys Populaation alkioista ei ole välttämättä täydellistä luetteloa 3

Ongelmia otannassa (2/2) Vastauskato Tutkimuksen kohteita ei tavoiteta tai he kieltäytyvät vastaamasta Vastausharha Kysymykset voivat olla huonosti muotoiltuja tai vastaajat voivat antaa vääriä tietoja Mittaamisesta Tilastotieteellinen tutkimus perustuu aina mitattaviin ilmiöihin Ominaisuuden mittaaminen liittää jonkin luvun mittauksen kohteen kyseessä olevaan ominaisuuteen Käsitteenmäärittely tärkeää! Mittaus tuottaa tuloksenaan aina jonkin (mitta)luvun 4

Mittaluku Mittaluku on satunnaismuuttujan havaittu arvo satunnaismuuttujalla on tulosvaihtoehdot Ilmiön luonteesta riippuen voidaan tulosvaihtoehdoille käyttää erilaisia mitta-asteikkoja Vaikka mitattava ilmiö ei olisikaan numeerinen, se voidaan aina koodata sellaiseksi Laatueroasteikko Mitta-asteikot mihin luokkaan kohde kuuluu mitattavan ominaisuuden perusteella Järjestysasteikko Onko mittauksen kohteella enemmän mitattavaa ominaisuutta kuin jollakin toisella kohteella Väli- ja suhdeasteikko Kuinka paljon kahden mittauksen kohteen ominaisuudet eroavat toisistaan 5

Mittari? Mittaaminen vaatii mittauksen kohteen kohteen hyvin määritellyn ominaisuuden, jota halutaan mitata mittarin, joka liittää mielekkäät lukuarvot mitattavaan ominaisuuteen Erilaiset mittarit heijastavat ilmiön ominaisuuksia eri tavoin ja eri tarkkuudella Mittausmalli Mittauksiin voi sisältyä mittausvirhettä Kaikki satunnaisvaihtelu ei ole peräisin otannasta Mittausmalli oleellinen Latentteja tekijöitä mitataan kysymyksillä, joihin liittyy mittausvirhettä Kysymysten lineaarikombinaatioina muodostetaan asteikko, joka kuvaa mahdollisimman hyvin latentteja tekijöitä 6

Faktorianalyysi Faktorianalyysissa pyritään löytämään muuttujien korrelaatioiden avulla niiden taustalla piilevä vähäulotteinen rakenne Muuttujien kokonaisvaihtelu jaetaan kahteen osaan: yhteisvaihteluun ja ominaisvaihteluun ( mittausvirhe mittausmallissa) Faktorianalyysin perusmalli Faktorianalyysin perusmalli voidaan esittää seuraavasti: x = Af + e, jossa x sisältää havaitut mitatut muuttujat (p kpl) f sisältää latentit muuttujat, faktorit (k kpl) e sisältää mittausvirheet (p kpl) A-matriisi (p x k) sisältää faktorilataukset 7

Rotaatio Faktorianalyysissa ovat olennaisia muuttujien väliset korrelaatiot, joita voi graafisesti hahmottaa muuttujien välisinä kulmina Periaatteessa on samantekevää, miten tämä muuttujakimppu sijaitsee faktoreiden muodostamassa koordinaatistossa Toisin sanoen faktorianalyysin ratkaisu ei ole yksikäsitteinen Tavallista onkin tehdä rotaatio eli kiertää koordinaatistoa, jotta päästäisiin mahdollisimman mielekkäästi tulkittaviin faktoreihin Faktorianalyysin suoritusvaiheet Faktoreiden lukumäärän arviointi Faktorointi Rotaatio Tulkinta (Faktoripistemäärien laskeminen) 8

Validiteetti (vanha) Muuttuja on ominaisuuden validi mittari, jos se esittää ominaisuutta oikein, merkityksellisesti ja tarkoituksenmukaisesti rakennevaliditeetti latentit tekijät vastaavat asteikkoa ennustevaliditeetti kuinka hyviä selittäjiä regressioanalyysissa käsitevaliditeetti ei matemaattinen Validiteetti (uusi) Validiteetilla tarkoitetaan niiden päätelmien sopivuutta, mielekkyyttä ja käyttökelpoisuutta, joita mittaustuloksista tehdään Validiteetti ei ole mittarin ominaisuus, vaan kuvaa sillä tehtyjä päätelmiä 9

Validiteetista (1/2) Ei ole erotettavissa erillisiä validiteetin lajeja tai puolia, vaan vain erityyppistä empiiristä evidenssiä yhdestä ja samasta asiasta eli niiden päätelmien validiteetista, joita mittauksista tehdään esim. sisältö-, kriteeri-, ennuste-, samanaikaisja konstruktiovaliditeetti Mittarin validiteetti ei ole kertaluonteinen tutkimustulos, vaan vähitellen kertyvää näyttöä Validiteetista (2/2) Validiteetti ei ole välttämättä kertoimena ilmaistava asia, vaan validiteettia voidaan perustella myös muunlaisen näytön perusteella Validiteettinäytön soveltuvuus tiettyyn mittaustilanteeseen riippuu siitä, mitä tai minkä tyyppisiä päätelmiä mittaustuloksista tehdään 10

Reliabiliteetti Mittaus on reliaabeli eli luotettava, jos se toistettaessa antaa samasta kohteesta saman (tai suurin piirtein saman) tuloksen Reliabiliteettikertoimeksi määritellään mittarin todellisen ja havaitun varianssin suhde Mittauksen reliabiliteettikerroin on yhtä suuri kuin kahden rinnakkaismittauksen havaittujen pistemäärien välinen korrelaatiokerroin Reliabiliteetti mittausmallissa Reliabiliteetti on mitta-asteikon tarkkuus Reliabiliteettikertoimen alarajan estimaattina käytetään usein Cronbachin α:aa Oletukset harvoin voimassa - ei pitäisi käyttää! 1 faktori mittaa n muuttujaa yhtä hyvin ja yhtä suurella mittausvirheellä Tarkkosen mitta parempi Cronbachin α ei voi ylittää Tarkkosen mitan arvoa Soveltuu myös moniulotteisiin tilanteisiin 11