Otanta-aineistojen analyysi

Samankaltaiset tiedostot
Otanta-aineistojen analyysi (78136, 78405) Kevät 2010 TEEMA 3: Frekvenssiaineistojen asetelmaperusteinen analyysi: Perusteita

(78143) Syksy 2009 TEEMAT 3 & 4. Risto Lehtonen Teema 3 ERITYISKYSYMYKSIÄ. Risto Lehtonen 2

Hierarkkisen aineiston mallintaminen ja otanta/pre-kurssi

Estimaattoreiden asetelmaperusteinen

Otanta-aineistojen analyysi (78136, 78405) Kevät 2010 TEEMA 4: Asetelmaperusteinen monimuuttuja-analyysi

Otanta-aineistojen analyysi

Tilastollisten menetelmien käyttö Kelan tutkimustoiminnassa

Otanta-aineistojen analyysi Kevät 2010 TEEMA 5: Tilastollinen mallinnus II Mallit, analyysimenetelmiä ja ohjelmia, PISA-esimerkki

Otanta-aineistojen analyysi

JY / METODIFESTIVAALI 2013 PRE-KURSSI: KYSELYTUTKIMUS DEMOT

Otanta-aineistojen analyysi

Pienalue-estimointi (78189) Kevät 2011 Risto Lehtonen

Pienalue-estimointi (78189) Kevät Risto Lehtonen Helsingin yliopisto

Kulutustutkimuksen alue-estimointi Pienalue-estimointimenetelmien vertailu Kulutustutkimus aineistossa

ATH-aineiston tilastolliset analyysit SPSS/PASW SPSS analyysit / Risto Sippola 1

Otantamenetelmät (78143) Syksy 2008 OSA 2: Malliavusteinen estimointi. Risto Lehtonen

Tilastollinen aineisto Luottamusväli

Otantamenetelmät. Syksy

Parametrin estimointi ja bootstrap-otanta

Perusestimointi 5 Analyysiä survey-datalla Tee Suomen datalla jokin oma kokeilu käyttäen tätä mallia Esimerkki PISA 2006:sta SAS:lla

Tommi Härkänen, Teppo Juntunen, Eero Lilja Analyysiohjeita Maahanmuuttajien terveys- ja hyvinvointitutkimusaineiston käsittelemiseksi.

Otantamenetelmät. (78143) Syksy 2010 TEEMA 1. Risto Lehtonen

EU-rikosuhritutkimus (Turvallisuus Suomessa) - pilottitutkimus. Vastauskato ja painotus Jenni Nikula

ATH-koulutus THL ATH-koulutus / Tommi Härkänen 1

MTTTP5, luento Otossuureita ja niiden jakaumia (jatkuu)

Pienalue-estimointi (78189) Kevät 2011 Risto Lehtonen

806354A/806629S Otantamenetelmät (5 op)

Health 2000/2011 Surveys. Statistical Analysis using SAS and SAS-Callable SUDAAN Packages Esa Virtala.

Luottamusvälit. Normaalijakauma johnkin kohtaan

Batch means -menetelmä

805306A Johdatus monimuuttujamenetelmiin, 5 op

Sovellettu todennäköisyyslaskenta B

2. Teoriaharjoitukset

Otoskeskiarvo on otossuure, jonka todennäköisyysjakauma tiedetään. Se on normaalijakauma, havainnollistaminen simuloiden

MS-C2128 Ennustaminen ja Aikasarja-analyysi, 5 op Esittely

2. Keskiarvojen vartailua

MS-C2128 Ennustaminen ja Aikasarja-analyysi, 5 op Esittely

Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi

Pienalue-estimointi (78189) Kevät 2011 Risto Lehtonen

54. Tehdään yhden selittäjän lineaarinen regressioanalyysi, kun selittäjänä on määrällinen muuttuja (ja selitettävä myös):

Osa 2: Otokset, otosjakaumat ja estimointi

Í«ª» ó «µ ³² ²º± ³ ±² ¼ <³ ²»²æ ±³»²»» ³< ²»²»³ ²»² µ» «

1. YKSISUUNTAINEN VARIANSSIANALYYSI: AINEISTON ESITYSMUODOT

Tilastotieteen kertaus. Kuusinen/Heliövaara 1

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

tilastotieteen kertaus

Monitasomallit koulututkimuksessa

MS-C2128 Ennustaminen ja Aikasarja-analyysi, 5 op Esittely

/1. MTTTP1, luento Normaalijakauma (kertausta) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti:

Regressioanalyysi. Vilkkumaa / Kuusinen 1

ATH-koulutus: Stata 11 THL ATH-koulutus / Tommi Härkänen 1

Harjoitus 7: NCSS - Tilastollinen analyysi

SAS/IML käyttö ekonometristen mallien tilastollisessa päättelyssä. Antti Suoperä

/1. MTTTP1, luento Normaalijakauma (jatkoa) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti:

Tilastokeskuksen liikevaihtoindeksien ennakkotietojen estimointimenetelmän kehittäminen. Heli Holtari. Tilastotieteen pro gradu -tutkielma

Testit laatueroasteikollisille muuttujille

Hypoteesin testaus Alkeet

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?

Capacity Utilization

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Testejä suhdeasteikollisille muuttujille

Teema 8: Parametrien estimointi ja luottamusvälit

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1

Regressioanalyysi. Kuusinen/Heliövaara 1

pitkittäisaineistoissa

Menetelmiä regressiomallin estimointiin kompleksisessa otanta-asetelmassa

7.4 Normaalijakauma (kertausta ja täydennystä) Taulukosta P(Z 1,6449) = 0,05, P(Z -1,6449) = 0,05 P(Z 1,96) = 0,025, P(Z -1,96) = 0,025

Kaksisuuntainen varianssianalyysi. Heliövaara 1

Tilastollisia peruskäsitteitä ja Monte Carlo

Estimointi populaation tuntemattoman parametrin arviointia otossuureen avulla Otossuure satunnaisotoksen avulla määritelty funktio

Normaalijakaumasta johdettuja jakaumia

Johdatus todennäköisyyslaskentaan Normaalijakaumasta johdettuja jakaumia. TKK (c) Ilkka Mellin (2005) 1

pitkittäisaineistoissa

031021P Tilastomatematiikka (5 op) kertausta 2. vk:een

Tilastollisen analyysin perusteet Luento 9: Moniulotteinen lineaarinen. regressio

Luento KERTAUSTA Kaksiulotteinen jakauma Pisteparvi, Toyota Avensis -farmariautoja

OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi. Luento 3

,ܾ jaü on annettu niin voidaan hakea funktion

Käytech päätösseminaari. Risto Heikkinen. Tilastollinen estimointi käytettävyystestien koehenkilöiden lukumäärän optimoinnin apuvälineenä

r = n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit.

Geenikartoitusmenetelmät. Kytkentäanalyysin teoriaa. Suurimman uskottavuuden menetelmä ML (maximum likelihood) Uskottavuusfunktio: koko aineisto

Mat Tilastollisen analyysin perusteet, kevät 2007

Viestinnän mentelmät I: sisällön erittely. Sisällönanalyysi/sisällön erittely. Sisällön erittely. Juha Herkman

Harjoitukset 4 : Paneelidata (Palautus )

r = r f + r M r f (Todistus kirjassa sivulla 177 tai luennon 6 kalvoissa sivulla 6.) yhtälöön saadaan ns. CAPM:n hinnoittelun peruskaava Q P

7. Lohkominen ja sulautus 2 k kokeissa. Lohkominen (Blocking)

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Viestinnän mentelmät I: sisällön erittely. Sisällönanalyysi/sisällön erittely. Sisällön erittely. Juha Herkman

Maximum likelihood-estimointi Alkeet

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

Tutkimustiedonhallinnan peruskurssi

805324A (805679S) Aikasarja-analyysi Harjoitus 6 (2016)

Osafaktorikokeet. Heliövaara 1

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

ATH-koulutus: R ja survey-kirjasto THL ATH-koulutus / Tommi Härkänen 1

30A02000 Tilastotieteen perusteet

Tilastotieteen aihehakemisto

Transkriptio:

Helsingin yliopisto Otanta-aineistojen analyysi Kevät 2010 Periodi III Risto Lehtonen Teema 2 Estimaattoreiden varianssien estimointi Survey-analyysin lähestymistavat Kuvaileva survey Descriptive survey Analyyttinen survey Analytical survey Asetelmaperusteinen survey-analyysi Design-based survey analysis Malliperusteinen / mallista riippuva survey-analyysi Model-based survey analysis Model-dependent survey analysis

Estimaattoreiden varianssin estimointi linearisointimenetelmällä ja pseudotoisto-otannan menetelmillä Linearisointimenetelmä (TAYLOR) Linearization method Taylor series expansion Pseudotoisto-otantaan perustuvat menetelmät Pseudoreplication, Sample re-use Jackknife-menetelmä (JACKKNIFE) Balanced Repeated Replications (BRR) Bootstrap-menetelmä (BOOT) Ohjelmasovellukset SAS: SURVEYMEANS, SURVEYREG, SURVEYFREQ, SURVEYLOGISTIC SAS Vers. 9.1.3 Linearisointimenetelmä (TAYLOR) SAS Vers. 9.2 (uusi versio) TAYLOR JACKKNIFE BRR

LINEARISOINTIMENETELMÄ Survey-analyysin ohjelmistot: SAS SURVEYMEANS, SURVEYREG, SURVEYFREQ, SURVEYLOGISTIC Epälineaariset estimaattorit Osajoukon koko satunnaismuuttuja Osajoukkojen osuusestimaattorit Osajoukkojen keskiarvoestimaattorit Regressiokertoimien estimaattorit Logitmallin kerroinestimaattorit HUOM: Ohjelmasovelluksissa (SAS, SPSS, Stata) estimaattoreiden varianssien estimointi perustuu otosrypäiden välisen varianssin estimointiin ositteittain Poikkeus: SUDAAN-ohjelmisto

Chapter 3 Specifying Your Sample Design Exhibit 3-1. Choosing the Taylor Series Design Option PSU SELECTION WITHOUT REPLACEMENT (n / N large, ANY Stratum) WITH REPLACEMENT (n / N small, ALL Strata) NOT CLUSTERED Equal Probabilities Within Strata CLUSTERED NOT CLUSTERED CLUSTERED STRWOR STRWR WR WOR Equal Probabilities, All Stages UNEQWOR Unequal Probabilities, Stage 1 Only 108 SUDAAN 8.0

* PERUSJOUKON OSAJOUKKOJA KOSKEVIEN OSUUKSIEN JA KESKIARVOJEN ESTIMOINTI Perusjoukko jaettu D osajoukkoon Binäärinen (0/1) indikaattorimuuttuja jos ositteen h rypään i alkio = 0 muulloin Binäärinen (0/1) tulosmuuttuja y jos ositteen h rypään i alkiolla k on tutkittava ominaisuus = 0 muulloin Estimoitavana osuusparametri (j=1,...,d) missä H ositteiden lkm perusjoukon rypäiden lkm ositteessa h perusjoukon alkioiden lkm ositteen h rypäässä i tulosmuuttujan y totaali osajoukossa j osajoukon alkioiden lkm 19

* SUHTEEN JA OSUUDEN ESTIMAATTORI Combined ratio estimator Osuusestimaattori, j=1,...,d (D osajoukkoa) missä Tulosmuuttujan y totaaliestimaattori osajoukossa j Osajoukon koon estimaattori ja vastaavat skaalatut luvut Painomuuttuja HUOM: Analyyttisissa tutkimuksissa painot w skaalataan usein niin, että niiden keskiarvo koko aineistossa = 1 Suhteen estimaattori on yksinkertaisin esimerkki epälineaarisesta estimaattorista HUOM: Merkintätapa (eikä ) korostaa sitä, että myös nimittäjä on satunnaismuuttuja 20

* LINEARISOINTIMENETELMÄ Suhteen estimaattorissa sekä osoittaja että nimittäjä ovat satunnaismuuttujia Tästä syystä asetelmaperusteisen varianssiestimaattorin tulee käsittää: - osoittajan varianssi v(y) - nimittäjän varianssi v(x) - osoittajan ja nimittäjän kovarianssi cov(y,x) Osajoukon osuustunnusluvun linearisointimenetelmään perustuva varianssiestimaattori on: HUOM: Vastaava malliperusteinen (binominen, SRS-perusteinen) varianssiestimaattori: 21

ESIMERKKI. Osuusestimaattorin varianssin approksimointi linearisointimenetelmällä Lehtonen&Pahkinen 2004, Example 5.5 OHC Survey demodata Ositettu ryväsotanta-asetelma H= 5 ositetta m= 250 toimipaikkaa (otosryvästä) n = 7841 henkilöä Binäärinen tulosmuuttuja PHYS Työn fysikaaliset terveyshaitat 0 = Ei ole 1 = On Estimointi: Työn fysikaalisista haitoista kärsivien miesten osuus Osuuden estimaatti: 23

Varianssiapproksimaatio: SAS / SURVEYMEANS Osuusestimaattorin asetelmaperusteinen varianssiestimaatti linearisointimenetelmän avulla: SRS-perusteinen (binomimalliin perustuva) varianssiestimaatti: Estimoitu asetelmakerroin: deff = 0.0002775/0.0000554 = 5.01 Suuri deff-estimaatti viittaa tulosmuuttujan PHYS voimakkaaseen positiiviseen sisäkorrelaatioon rypäissä Binominen varianssiestimaatti aliestimoi selvästi todellista varianssia 24