(78143) Syksy 2009 TEEMAT 3 & 4. Risto Lehtonen Teema 3 ERITYISKYSYMYKSIÄ. Risto Lehtonen 2

Samankaltaiset tiedostot
Otanta-aineistojen analyysi (78136, 78405) Kevät 2010 TEEMA 3: Frekvenssiaineistojen asetelmaperusteinen analyysi: Perusteita

Otanta-aineistojen analyysi

Tilastollisten menetelmien käyttö Kelan tutkimustoiminnassa

Hierarkkisen aineiston mallintaminen ja otanta/pre-kurssi

Otanta-aineistojen analyysi

Pienalue-estimointi (78189) Kevät Risto Lehtonen Helsingin yliopisto

Otanta-aineistojen analyysi (78136, 78405) Kevät 2010 TEEMA 4: Asetelmaperusteinen monimuuttuja-analyysi

Otanta-aineistojen analyysi Kevät 2010 TEEMA 5: Tilastollinen mallinnus II Mallit, analyysimenetelmiä ja ohjelmia, PISA-esimerkki

Pienalue-estimointi (78189) Kevät 2011 Risto Lehtonen

JY / METODIFESTIVAALI 2013 PRE-KURSSI: KYSELYTUTKIMUS DEMOT

Otanta-aineistojen analyysi

Otantamenetelmät (78143) Syksy 2008 OSA 2: Malliavusteinen estimointi. Risto Lehtonen

Otantamenetelmät. Syksy

Estimaattoreiden asetelmaperusteinen

Health 2000/2011 Surveys. Statistical Analysis using SAS and SAS-Callable SUDAAN Packages Esa Virtala.

Monitasomallit koulututkimuksessa

ATH-aineiston tilastolliset analyysit SPSS/PASW SPSS analyysit / Risto Sippola 1

Perusestimointi 5 Analyysiä survey-datalla Tee Suomen datalla jokin oma kokeilu käyttäen tätä mallia Esimerkki PISA 2006:sta SAS:lla

Tommi Härkänen, Teppo Juntunen, Eero Lilja Analyysiohjeita Maahanmuuttajien terveys- ja hyvinvointitutkimusaineiston käsittelemiseksi.

TUTKIMUSOPAS. SPSS-opas

Otantamenetelmät. (78143) Syksy 2010 TEEMA 1. Risto Lehtonen

Perhevapaiden palkkavaikutukset

Efficiency change over time

Pienalue-estimointi (78189) Kevät 2011 Risto Lehtonen

Supplementary Table S1. Material list (a) Parameters Sal to Str

Otanta-aineistojen analyysi

Kulutustutkimuksen alue-estimointi Pienalue-estimointimenetelmien vertailu Kulutustutkimus aineistossa

3 9-VUOTIAIDEN LASTEN SUORIUTUMINEN BOSTONIN NIMENTÄTESTISTÄ

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

ATH-koulutus: Stata 11 THL ATH-koulutus / Tommi Härkänen 1

Statistical design. Tuomas Selander

Gap-filling methods for CH 4 data

European Certificate for Quality in Internationalisation. Mafi Saarilammi Korkeakoulujen arviointineuvosto

SAS/IML käyttö ekonometristen mallien tilastollisessa päättelyssä. Antti Suoperä

Heisingin kaupungin tietokeskus Helsingfors stads faktacentral City of Helsinki Urban Facts 0N THE EFFECTS 0F URBAN NATURAL AMENITIES, ARCHITECTURAL

Capacity Utilization

2 1. Johdanto Tama Geologian tutkimuskeskuksen Kuopion yksikon tekema mineraalivarantoarvio koskee Niinikosken esiintymaa Kotalahden nikkelivyohykkeel

Otoskoon arviointi. Tero Vahlberg

Kaksisuuntaisen varianssianalyysin tilastollisessa malli voidaan esittää seuraavassa muodossa:

1. YKSISUUNTAINEN VARIANSSIANALYYSI: AINEISTON ESITYSMUODOT

Helsingin yliopisto Sosiaalitieteiden laitos Seppo Tammikuu 2013 Surveymetodiikan koe

The CCR Model and Production Correspondence

PIENALUE-ESTIMOINTIMENETELMÄT:

Graph. COMPUTE x=rv.normal(0,0.04). COMPUTE y=rv.normal(0,0.04). execute.

Kyselytutkimusten. Erkki Pahkinen Kyselytutkimusten otantamenetelmät ja aineistoanalyysi. Erkki Pahkinen OTANTAMENETELMÄT JA AINEISTOANALYYSI

OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi. Luento 3

SPSS ohje. Metropolia Business School/ Pepe Vilpas

ATH-koulutus THL ATH-koulutus / Tommi Härkänen 1

SAS ja R yhteiskäyttö

Laskuharjoitus 9, tehtävä 6

ISEB/ISTQB FOUNDATION CERTIFICATE IN SOFTWARE TESTING III

Spatiaalinen metsää kuvaava malli ja sen soveltaminen metsäninventointiin

Pienalue-estimointi (78189) Kevät 2011 Risto Lehtonen

Capacity utilization

ECVETin soveltuvuus suomalaisiin tutkinnon perusteisiin. Case:Yrittäjyyskurssi matkailualan opiskelijoille englantilaisen opettajan toteuttamana

Jakaumien merkitys biologisissa havaintoaineistoissa: Löytyykö ratkaisu Yleistetyistä Lineaarisista (Seka)Malleista?

Benchmarking Controlled Trial - a novel concept covering all observational effectiveness studies

The relationship between leisuretime physical activity and work stress with special reference to heart rate variability analyses

Estimointityökalut. Pekka Forselius, Senior Advisor Finnish Software Measurement Association FiSMA ry

806354A/806629S Otantamenetelmät (5 op)

Returns to Scale II. S ysteemianalyysin. Laboratorio. Esitelmä 8 Timo Salminen. Teknillinen korkeakoulu

MTTTP5, luento Luottamusväli, määritelmä

FYYSINEN SUUNNITTELU

Mitä IHMEttä on MIXTURE -mallintaminen?

Tutkimuslääkkeiden GMP. Fimea Pirjo Hänninen

EU-rikosuhritutkimus (Turvallisuus Suomessa) - pilottitutkimus. Vastauskato ja painotus Jenni Nikula

Testit laatueroasteikollisille muuttujille

Lataa Cognitive Function in Opioid Substitution Treated Patiens - Pekka Rapeli. Lataa

Harha mallin arvioinnissa

CIE Division 1: Vision and Colour. MarjukkaPuolakka

Research plan for masters thesis in forest sciences. The PELLETime 2009 Symposium Mervi Juntunen

I. AES Rijndael. Rijndael - Internal Structure

Tietorakenteet ja algoritmit

Yrittäjien ja selvittäjien näkemykset yritysten suorituskyvystä

Laskennallinen data-analyysi II

SEM1, työpaja 2 ( )

I. Principles of Pointer Year Analysis

Tilastollinen vastepintamallinnus: kokeiden suunnittelu, regressiomallin analyysi, ja vasteen optimointi. Esimerkit laskettu JMP:llä

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?

Tilastokeskuksen liikevaihtoindeksien ennakkotietojen estimointimenetelmän kehittäminen. Heli Holtari. Tilastotieteen pro gradu -tutkielma

Stormwater filtration unit

Pienet ännät tutkimuksessa Tilastollisen analyysin työpaja. Jari Westerholm Niilo Mäki instituutti Jyväskylän yliopisto

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

*) %-yks. % 2018*)

Parametrin estimointi ja bootstrap-otanta

Missing data may bias your conclusions. Juha Karvanen Department of Mathematics and Statistics University of Jyväskylä

Mediaanikorko on kiinteäkorkoiselle lainalle korkeampi. Tämä hypoteesi vastaa taloustieteen käsitystä korkojen määräytymismekanismista.

Pakettisynkronointitestauksen automaatio

IBM SPSS Statistics 21 (= SPSS 21)

Tavaroiden ulkomaankauppatilastojen tulkinnan haasteet Timo Koskimäki

UEF Statistics Teaching Bulletin, Fall 2017

Suomen Anestesiasairaanhoitajat ry Anestesiakurssi 2015

Painotusmenetelmät survey-datalle Helsingin yliopiston lyhytkurssi, kevät 2009 Seppo Laaksonen

muutos *) %-yks. % 2016

ATH-koulutus: R ja survey-kirjasto THL ATH-koulutus / Tommi Härkänen 1

SIZE 8 (EN 420:2003+A1:2009)

Metsien vertailutason määrittäminen taustat ja tilanne

1. PÄÄTTELY YHDEN SELITTÄJÄN LINEAARISESTA REGRESSIOMALLISTA

AKKREDITOITU TESTAUSLABORATORIO ACCREDITED TESTING LABORATORY VERKOTAN OY VERKOTAN LTD.

54. Tehdään yhden selittäjän lineaarinen regressioanalyysi, kun selittäjänä on määrällinen muuttuja (ja selitettävä myös):

Transkriptio:

Otantamenetelmät (78143) Syksy 2009 TEEMAT 3 & 4 Risto Lehtonen risto.lehtonen@helsinki.fi Teema 3 ERITYISKYSYMYKSIÄ Risto Lehtonen 2 1

Otannan erityiskysymyksiä Ryväsotanta Survey sampling reference guidelines (2008 edition) Introduction to sample design and estimation techniques Section 3.2.5 Cluster sampling Otoskoon määrääminen Survey sampling reference guidelines (2008 edition) Introduction to sample design and estimation techniques Section 3.3 Sample size determination Vastauskadon hallinnan perusteita Lehtonen-Pahkinen (2004) Chapter 3 VLISS Training Key 114, 117, 123 Sisäkorrelaatio ryväsotannassa Samaan rypääseen kuulumisella on taipumus samankaltaistaa alkioita tutkittavien ilmiöiden suhteen Koulututkimukset Rypäänä opetusryhmä Oppimistulokset, esim. PISA Työolotutkimukset Rypäänä työpaikka Työolot, esim. Kelan työterveyshuoltotutkimus OHC data, VLISS Risto Lehtonen 4 2

Sisäkorrelaatio Sisäkorrelaatio ˆ ρ int Intra - cluster correlation Likimääräinen kaava ˆ ρint = ( deff 1)/( m 1) missä m on keskimääräinen ryväskoko Rypäät ovat usein positiivisesti sisäkorreloituneita eli ˆ ρint > 0 kun deff > 1 Lisäksi on voimassa: deff ( p ˆ) = 1 + ( m 1) ˆ ρint missä deff ( pˆ ) on asetelmakerroin ( design effect) Risto Lehtonen 5 Esimerkkiaineisto: Työterveyshuoltotutkimus OHC Otanta-asetelma Ositettu yksi- ja kaksiasteinen ryväsotanta Toimipaikat rypäinä Ositus rypään koon ja toimialan mukaan - Pienet toimipaikat: Yksiasteinen otanta - Suuret toimipaikat: Kaksiasteinen otanta Henkilötasolla likimain itsepainottuva (self-weighting) otos Demonstraatioaineisto SAS-data OHC Rajaus: Toimipaikat, joissa vähintään 10 työntekijää H = 5 ositetta (strata) m = 250 toimipaikkaa (ryvästä, clusters) n = 7841 henkilöä Vaihteleva määrä otosrypäitä per osite 3

Deff-estimaatit OHC (Lehtonen&Pahkinen 2004) Table 5.8 Averages of design-effect estimates of proportion estimates of selected groups of binary response variables in the OHC Survey data set (number of variables in parentheses). Study variable Mean deff Physical working conditions (12) 6.5 Psycho-social working conditions (11) 3.3 Psychosomatic symptoms (8) 2.0 Psychic symptoms (9) 1.8 Teema 4 OHJELMISTO Risto Lehtonen 8 4

Ohjelmisto SAS-ohjelmisto SAS-proseduurit SAS-makrot SPSS module Complex Samples Stata:n svy-ohjelmat Erikoisalue: Pienalue-estimointi SAS-makro EBLUPGREG Ohjelma Domest R-kieliset ohjelmat Software Risto Lehtonen 9 SAS-ohjelmisto, kuvailu Survey-proseduurit, joilla otanta-asetelma (ositus, ryvästyminen, painotus) voidaan ottaa huomioon estimoinnissa SURVEYMEANS Keskiarvot ja kokonaismäärät SURVEYREG Regressioestimointi i SURVEYFREQ Ristiintaulukointi ja perustestit Risto Lehtonen 10 5

SAS-ohjelmisto, analyysi SURVEYFREQ Monipuolinen valikoima tilastollisia testejä SURVEYREG Lineaariset mallit SURVEYLOGISTIC Logistiset mallit Risto Lehtonen 11 SAS-proseduuri SURVEYMEANS Asetelmaperusteinen estimointi Kokonaismäärien, keskiarvojen ja osuuksien estimointi koko aineistossa ja osajoukoissa Osajoukkoestimointi (domains) BY statement Ositekohtainen estimointi (planned domains) DOMAIN statement Estimointi muuntyyppisille osajoukoille (unplanned domains) Risto Lehtonen 12 6

SAS-makrot, pienalue-estimointi EURAREA Project http://www.statistics.gov.uk/eurarea/ Asetelmaperusteinen estimointi GREG with linear fixed-effects models Malliperusteinen estimointi Standard estimators (EBLUP) Estimators with spatial or temporal effects Estimators for cross-classifications Proper MSE estimation Risto Lehtonen 13 EURAREA Project The EURAREA "Standard" Estimators and performance criteria* Office for National Statistics, UK Area-level Composite Estimator with Time-Varying Area Effect* Office for National Statistics, UK EBLUPGREG: Unit-level Composite Estimator with Spatial or Temporal Effects* Statistics Finland Unit-level Composite Estimator with Spatial Effects* ISTAT, Italy Small Area Estimation with Sampling Weights* INE, Spain / UMH, Spain Cross Classifications with Two-way and Three-way tables* ISTAT, Italy Risto Lehtonen 14 7

Ohjelma DOMEST Stand-alone Java program for estimation of totals and means for domains and small areas Developed by Dr. Ari Veijanen (Statistics Finland and University of Helsinki) Estimators HT and Hájek estimator GREG and SYN with linear model GREG and SYN with linear mixed model EBLUP with linear mixed model Risto Lehtonen 15 Risto Lehtonen 16 8

R-kieliset ohjelmat R-kielisiä ohjelmia on tekeillä eri EU- projekteissa (FP7) SAMPLE project (EU FP7) AMELI project (EU FP7) Demoissa käytetään SAS-ohjelmiston proseduureja SURVEYSELECT SURVEYMEANS SURVEYREG Risto Lehtonen 17 Kuinka jatkaa eteenpäin? Yhteiskuntatilastotiede, kevät 2010 Otanta-aineistojen aineistojen analyysi Imputointimenetelmät Painotusmenetelmät surveyssä Tilastolliset tietosuojamenetelmät Pro gradu yhteiskuntatilastotieteen alalta Tilastokeskus Kelan tutkimusosasto Muu valtionhallinnon tutkimuslaitos tai virasto 9