Otannasta ja mittaamisesta Tilastotiede käytännön tutkimuksessa - kurssi, kesä 2001 Reijo Sund Aineistot Kvantitatiivisen tutkimuksen aineistoksi kelpaa periaatteessa kaikki havaintoihin perustuva informaatio, joka on mittauksen avulla muutettavissa numeeriseen muotoon Aineiston hankinta vaatii yleensä runsaasti käytännön työtä Huonosti toteutettu aineiston keruu estää johtopäätösten teon 1
Aineistotyyppejä Poikkileikkausaineisto Tietoja yhdeltä ajanhetkeltä tai aikaväliltä Paneeliaineisto Tietoja useilta ajanhetkiltä Tapahtumahistoria-aineisto Tietoja tapahtumahetkiltä Otantatutkimus Otantatutkimuksissa otos valitaan siitä populaatiosta, josta halutaan saada tietoja Perusoletuksena on otoksen yleistettävyys koko populaatioon Tilastollisen mallin parametrit estimoidaan käytettävissä olevan aineiston (otoksen) perusteella 2
Otanta-asetelmia Otos voidaan valita populaatiosta usealla eri tavalla Yksinkertainen satunnaisotanta Jokaisella tietyn kokoisella otoksella sama mahdollisuus tulla valituksi Ositettu otanta Populaatio jaetaan homogeenisiin ositteisiin, joista jokaisesta sitten poimitaan erillinen otos Moniasteinen otanta Hyödynnetään populaation hierarkkista jakoa Ongelmia otannassa (1/2) Poimintaharha otos ei edusta populaatiota Vaarana varsinkin silloin, kun otokseen tulleet populaation alkiot ovat valikoituneet tai ovat itse valinneet itsensä otokseen Vajaapeittävyys Populaation alkioista ei ole välttämättä täydellistä luetteloa 3
Ongelmia otannassa (2/2) Vastauskato Tutkimuksen kohteita ei tavoiteta tai he kieltäytyvät vastaamasta Vastausharha Kysymykset voivat olla huonosti muotoiltuja tai vastaajat voivat antaa vääriä tietoja Mittaamisesta Tilastotieteellinen tutkimus perustuu aina mitattaviin ilmiöihin Ominaisuuden mittaaminen liittää jonkin luvun mittauksen kohteen kyseessä olevaan ominaisuuteen Käsitteenmäärittely tärkeää! Mittaus tuottaa tuloksenaan aina jonkin (mitta)luvun 4
Mittaluku Mittaluku on satunnaismuuttujan havaittu arvo satunnaismuuttujalla on tulosvaihtoehdot Ilmiön luonteesta riippuen voidaan tulosvaihtoehdoille käyttää erilaisia mitta-asteikkoja Vaikka mitattava ilmiö ei olisikaan numeerinen, se voidaan aina koodata sellaiseksi Laatueroasteikko Mitta-asteikot mihin luokkaan kohde kuuluu mitattavan ominaisuuden perusteella Järjestysasteikko Onko mittauksen kohteella enemmän mitattavaa ominaisuutta kuin jollakin toisella kohteella Väli- ja suhdeasteikko Kuinka paljon kahden mittauksen kohteen ominaisuudet eroavat toisistaan 5
Mittari? Mittaaminen vaatii mittauksen kohteen kohteen hyvin määritellyn ominaisuuden, jota halutaan mitata mittarin, joka liittää mielekkäät lukuarvot mitattavaan ominaisuuteen Erilaiset mittarit heijastavat ilmiön ominaisuuksia eri tavoin ja eri tarkkuudella Mittausmalli Mittauksiin voi sisältyä mittausvirhettä Kaikki satunnaisvaihtelu ei ole peräisin otannasta Mittausmalli oleellinen Latentteja tekijöitä mitataan kysymyksillä, joihin liittyy mittausvirhettä Kysymysten lineaarikombinaatioina muodostetaan asteikko, joka kuvaa mahdollisimman hyvin latentteja tekijöitä 6
Faktorianalyysi Faktorianalyysissa pyritään löytämään muuttujien korrelaatioiden avulla niiden taustalla piilevä vähäulotteinen rakenne Muuttujien kokonaisvaihtelu jaetaan kahteen osaan: yhteisvaihteluun ja ominaisvaihteluun ( mittausvirhe mittausmallissa) Faktorianalyysin perusmalli Faktorianalyysin perusmalli voidaan esittää seuraavasti: x = Af + e, jossa x sisältää havaitut mitatut muuttujat (p kpl) f sisältää latentit muuttujat, faktorit (k kpl) e sisältää mittausvirheet (p kpl) A-matriisi (p x k) sisältää faktorilataukset 7
Rotaatio Faktorianalyysissa ovat olennaisia muuttujien väliset korrelaatiot, joita voi graafisesti hahmottaa muuttujien välisinä kulmina Periaatteessa on samantekevää, miten tämä muuttujakimppu sijaitsee faktoreiden muodostamassa koordinaatistossa Toisin sanoen faktorianalyysin ratkaisu ei ole yksikäsitteinen Tavallista onkin tehdä rotaatio eli kiertää koordinaatistoa, jotta päästäisiin mahdollisimman mielekkäästi tulkittaviin faktoreihin Faktorianalyysin suoritusvaiheet Faktoreiden lukumäärän arviointi Faktorointi Rotaatio Tulkinta (Faktoripistemäärien laskeminen) 8
Validiteetti (vanha) Muuttuja on ominaisuuden validi mittari, jos se esittää ominaisuutta oikein, merkityksellisesti ja tarkoituksenmukaisesti rakennevaliditeetti latentit tekijät vastaavat asteikkoa ennustevaliditeetti kuinka hyviä selittäjiä regressioanalyysissa käsitevaliditeetti ei matemaattinen Validiteetti (uusi) Validiteetilla tarkoitetaan niiden päätelmien sopivuutta, mielekkyyttä ja käyttökelpoisuutta, joita mittaustuloksista tehdään Validiteetti ei ole mittarin ominaisuus, vaan kuvaa sillä tehtyjä päätelmiä 9
Validiteetista (1/2) Ei ole erotettavissa erillisiä validiteetin lajeja tai puolia, vaan vain erityyppistä empiiristä evidenssiä yhdestä ja samasta asiasta eli niiden päätelmien validiteetista, joita mittauksista tehdään esim. sisältö-, kriteeri-, ennuste-, samanaikaisja konstruktiovaliditeetti Mittarin validiteetti ei ole kertaluonteinen tutkimustulos, vaan vähitellen kertyvää näyttöä Validiteetista (2/2) Validiteetti ei ole välttämättä kertoimena ilmaistava asia, vaan validiteettia voidaan perustella myös muunlaisen näytön perusteella Validiteettinäytön soveltuvuus tiettyyn mittaustilanteeseen riippuu siitä, mitä tai minkä tyyppisiä päätelmiä mittaustuloksista tehdään 10
Reliabiliteetti Mittaus on reliaabeli eli luotettava, jos se toistettaessa antaa samasta kohteesta saman (tai suurin piirtein saman) tuloksen Reliabiliteettikertoimeksi määritellään mittarin todellisen ja havaitun varianssin suhde Mittauksen reliabiliteettikerroin on yhtä suuri kuin kahden rinnakkaismittauksen havaittujen pistemäärien välinen korrelaatiokerroin Reliabiliteetti mittausmallissa Reliabiliteetti on mitta-asteikon tarkkuus Reliabiliteettikertoimen alarajan estimaattina käytetään usein Cronbachin α:aa Oletukset harvoin voimassa - ei pitäisi käyttää! 1 faktori mittaa n muuttujaa yhtä hyvin ja yhtä suurella mittausvirheellä Tarkkosen mitta parempi Cronbachin α ei voi ylittää Tarkkosen mitan arvoa Soveltuu myös moniulotteisiin tilanteisiin 11