Hierarkkisen aineiston mallintaminen ja otanta/pre-kurssi

Koko: px
Aloita esitys sivulta:

Download "Hierarkkisen aineiston mallintaminen ja otanta/pre-kurssi"

Transkriptio

1 Hierarkkisen aineiston mallintaminen ja otanta/pre-kurssi Risto Lehtonen, Helsingin yliopisto Metodifestivaali Jyväskylän yliopisto Keskiviikko Hierarkkisuus otanta- asetelmaperusteisessa analyysissa Lounastauko Esimerkkianalyyseja Kahvitauko PC-harjoitukset SAS- ja R-ohjelmistoilla JY Metodifestivaali Risto Lehtonen

2 Hierarkkisen aineiston mallintaminen ja otanta/pre-kurssi Kurssilla käsitellään hierarkkisen (tai monitasoisen) tutkimusaineiston tilastollista mallintamista ja otantaa. Kun tutkimusaineistossa on havaintoyksiköitä ryhmittelevä luonnollinen rakenne eikä havaintoyksiköiden riippumattomuusoletus ole voimassa, on tämä otettava huomioon tilastollisessa mallintamisessa. Muuten vaarana on, että analyysitulokset sekä niistä tehtävät sisällölliset tulkinnat ja johtopäätökset ovat virheellisiä. JY Metodifestivaali Risto Lehtonen Hierarkkisen aineiston mallintaminen ja otanta/pre-kurssi Monitasomalli sisältää sekä aineiston rakenteen että havaintoyksiköiden keskinäisen riippuvuuden. Monitasomalli voi sisältää sekä ryhmä- että yksilötason selittäjiä. Kurssin suoritus: luennot, harjoitukset ja erikseen sovittava tehtävä JY Metodifestivaali Risto Lehtonen

3 Käsiteltäviä asioita Terminologiaa Havaintojen keskinäisen riippuvuuden lähteitä Korreloituneisuuteen reagointi analyysissa Tilastollisen analyysin tyylilajit Analyysimenetelmiä, ja sovelluksia Huomioita tilastollisista ohjelmistoista JY Metodifestivaali Risto Lehtonen Terminologiaa Hierarkkisesti rakentunut aineisto Havaintojen korreloituneisuus Correlated data, Dependent data Clustered data, Cluster correlated data Autokorrelaatio Aikadimensio Spatiaalinen korrelaatio Tiladimensio Sisäkorrelaatio Ryhmän sisäinen korrelaatio Hierarkkinen malli Hierarchical model Monitasomalli Multilevel model Sekamalli Mixed model 3

4 OHC Survey Kaksitasoinen hierarkkinen rakenne Kaksiasteinen ryväsotanta: Perusjoukot Toimipaikka TMP-PJ 1 Toimipaikka 2 Toimipaikka M Työntekijä 11 Työntekijä 21 Työntekijä M1 Työntekijä 12 Työntekijä 22 Työntekijä M2 HENKILÖ- PJ Työntekijä 2j.Työntekijä Mj JY Metodifestivaali Risto Lehtonen OHC Survey Kaksitasoinen hierarkkinen rakenne Kaksiasteinen ryväsotanta: Poimittu otos TMP- OTOS Toimipaikka 2 Toimipaikka M Työntekijä 22 Työntekijä M2 Työntekijä 2j.Työntekijä Mj HENKILÖ- OTOS JY Metodifestivaali Risto Lehtonen

5 Havaintojen korreloituneisuuden lähteitä: Tutkimusasetelma ja otanta-asetelma 1. Alkiotason otanta Tutkimusasetelma a. Poikkileikkaus b. Pitkittäisasetelma asetelma 2. Ryväsotanta JY Metodifestivaali Risto Lehtonen Havaintojen korreloituneisuuden lähteitä: Tutkimusasetelma ja otanta-asetelma Otantaasetelma Tutkimusasetelma Otanta a. Poikkileikkaus b. Pitkittäisasetelma asetelma asetelma 1. Alkiotason otanta 1a. Ei havaintojen korreloituneisuutta 2. Ryväsotanta JY Metodifestivaali Risto Lehtonen

6 Havaintojen korreloituneisuuden lähteitä: Tutkimusasetelma ja otanta-asetelma 2. Ryväsotanta 2a. Positiivinen rypäänsisäinen korrelaatio JY Metodifestivaali Risto Lehtonen Havaintojen korreloituneisuuden lähteitä: Tutkimusasetelma ja otanta-asetelma Tutkimusasetelma Otanta a. Poikkileikkaus b. Pitkittäisasetelma asetelma asetelma 1. Alkiotason otanta 1a. Ei havaintojen korreloituneisuutta Tutkimusasetelma Otanta a. Poikkileikkaus b. Pitkittäisasetelma asetelma asetelma 1. Alkiotason otanta 1a. Ei havaintojen korreloituneisuutta 1b. Positiivinen autokorrelaatio 2. Ryväsotanta 2a. Positiivinen rypäänsisäinen korrelaatio JY Metodifestivaali Risto Lehtonen

7 Havaintojen korreloituneisuuden lähteitä: Tutkimusasetelma ja otanta-asetelma 2. Ryväsotanta 2a. Positiivinen rypäänsisäinen korrelaatio 2b. Ristikkäinen autokorrelaatio ja ryväskorrelaatio äk JY Metodifestivaali Risto Lehtonen Esimerkkejä hierarkkisesti rakentuneista tutkimusaineistoista Terveys 2000 PISA Terveyskeskuspiiri Poikkileikkaus 2-asteinen ositettu ryväsotanta 1-asteinen ositettu ryväsotanta ECHP Paneeli 1-asteinen ositettu tt ryväsotanta OHC Survey 2-asteinen ositettu ryväsotanta Poikkileikkaus Koulu tai opetusryhmä Koti- talous Tutkimusasetelma Otanta a. Poikkileikkaus b. Pitkittäisasetelma asetelma asetelma 1. Alkiotason otanta 1a. Ei havaintojen korreloituneisuutta 1b. Positiivinen autokorrelaatio Tutkimusaineisto Tutkimusasetelma Otantaasetelma Ryväsrakenne Havaintoyksikkö Henkilö Oppilas Koti- talouden jäsen Poikkileikkaus Toimipaikka Työntekijä JY Metodifestivaali Risto Lehtonen

8 Esimerkkiaineisto: Työterveyshuoltotutkimus Occupational Health Care Survey OHC Survey Tutkimusasetelma: Poikkileikkaustutkimus Otanta-asetelma Ositettu yksi- ja kaksiasteinen ryväsotanta Toimipaikat rypäinä Ositus rypään koon ja toimialan mukaan Pienet toimipaikat: Yksiasteinen otanta Suuret toimipaikat: Kaksiasteinen otanta Henkilötasolla itsepainottuva (self-weighting) otos Havaintojen riippuvuus: Rypäiden positiivinen sisäkorrelaatio JY Metodifestivaali Risto Lehtonen Esimerkkiaineisto: Työterveyshuoltotutkimus Occupational Health Care Survey OHC Survey Demonstraatioaineisto SAS-data OHCjy Rajaus Toimipaikat, joissa vähintään 10 työntekijää H = 5 ositetta (strata) m = 250 toimipaikkaa (ryvästä, clusters) ) n = 7841 henkilöä Vaihteleva määrä otosrypäitä per osite JY Metodifestivaali Risto Lehtonen

9 OHC Survey SAS data OHCjy: Muuttujaluettelo Variables in Creation Order # Variable Type Len Label 1 OSITE Num 8 Stratum identifier 2 RYVAS Num 8 Cluster identifier 3 ID Num 8 Element identifier 4 SEX Num 8 Gender 5 AGE Num 8 Age in years 6 AGE2 Num 8 Age under/over 45 7 PHYS Num 8 Physical health hazards of work 8 CHRON Num 8 Chronic morbidity 9 PSYCH Num 8 Psychic strain - 1st princomp 10 PSYCH2 Num 8 Psychic strain - dichotomy JY Metodifestivaali Risto Lehtonen OHC Survey SAS-data OHCjy OHCjy 7841 henkilöä 10 muuttujaa 5 ositetta 250 otosryvästä Rypäinä toimipaikat JY Metodifestivaali Risto Lehtonen

10 Rypäiden positiivisen sisäkorrelaation vaikutukset analyysin kannalta Vastaavankokoiseen alkiotasoiseen otanta- aineistoon verrattuna ryväsotanta-aineistossa: aineistossa: Tehokas otoskoko pienenee Tunnuslukujen keskivirheet kasvavat Luottamusvälit (virhemarginaalit) suurenevat Testisuureiden tilastollinen merkitsevyys heikkenee JY Metodifestivaali Risto Lehtonen Asetelmakerroin Deff ja sisäkorrelaatio Asetelmakerroin (Design effect, deff) mittaa otanta-asetelman ryvästymisen vaikutusta estimaattorin varianssiin Esimerkiksi osuustunnusluvun (suhteellisen osuuden) estimoitu asetelmakerroin on: v ˆ ˆ clu( p) vclu( p) deff ( pˆ ) = = = 1 + ( n 1) ˆ ρint v ( ˆ) ˆ(1 ˆ srs p p p)/ n missä ˆp on estimoitu osuustunnusluku ˆ ρ int on sisäkorrelaatio (intra-cluster correlation) n on rypäiden keskimääräinen otoskoko v clu on ryväsotanta-asetelman mukainen otosvarianssi srs v on yksinkertaiseen satunnaisotantaan perustuva otosvarianssi (tässä binominen varianssilauseke) JY Metodifestivaali Risto Lehtonen

11 SAS data OHCjy: Deff-estimaatit (Lehtonen&Pahkinen 2004) Table 5.8 Averages of design-effect estimates of proportion estimates of selected groups of binary response variables in the OHC Survey data set (number of variables in parentheses). Study variable Mean deff Physical working conditions (12) 6.5 Psycho-social working conditions (11) 3.3 Psychosomatic symptoms (8) 2.0 Psychic symptoms (9) 1.8 JY Metodifestivaali Risto Lehtonen Asetelmakerroin, sisäkorrelaatio ja tehokas otoskoko Asetelmakerroin ja sisäkorrelaatio ˆ ρ int deff ( p ˆ ) 1 = n 1 Tehokas otoskoko (efficient sample size): n eff n n = = deff ( pˆ ) 1 + ( n 1) ˆ ρint missä n on alkiotason otoskoko n on rypäiden keskimääräinen otoskoko JY Metodifestivaali Risto Lehtonen

12 Tehokas otoskoko ja sisäkorrelaatio SAS data OHCjy: Fysikaaliset työolot Asetelmakerroin deff = 6.5 Sisäkorrelaatio rho = Otoskoko n = 7841 henkilöä Tehokas otoskoko n(eff) = 7841/6.5 = 1206 henkilöä JY Metodifestivaali Risto Lehtonen Tehokas otoskoko ja sisäkorrelaatio SAS data OHCjy: Psyykkiset oireet Asetelmakerroin deff = 1.8 Sisäkorrelaatio rho = Otoskoko n = 7841 henkilöä Tehokas otoskoko n(eff) = 7841/1.8 = 4356 henkilöä JY Metodifestivaali Risto Lehtonen

13 OHC Survey Tilastollinen analyysi Kysymys: Millä vaihtoehtoisilla tavoilla voidaan reagoida tilastollisen analyysin yhteydessä OHCtutkimuksen otanta-asetelman ominaisuuksiin? Ositettu kaksiasteinen ryväsotanta Painotus - painomuuttuja: Tässä painot = 1 Ositus - ositusmuuttuja OSITE Ryvästyminen - ryväsmuuttuja RYVAS JY Metodifestivaali Risto Lehtonen OHC Survey Tilastollinen analyysi Tarkastellaan esimerkinomaisesti kahta vaihtoehtoista lähestymistapaa Asetelmaperusteinen (Design-based) tilastollinen analyysi Binäärinen vaste: Logistinen kiinteiden tekijöiden malli (logit ANCOVA) Malliperusteinen (Model-based) tilastollinen analyysi Binäärinen vaste: Logistinen sekamalli (logit ANCOVA) JY Metodifestivaali Risto Lehtonen

14 Asetelmaperusteinen (design-based) analyysi Perinteinen lähestymistapa mutkikkaiden otantaasetelmien tilanteissa Aineiston tilastollisessa analyysissa luovutaan oletuksesta, että havainnot olisivat toisistaan riippumattomia Luovutaan iid-oletuksesta (independent identically distributed) Sallitaan, että havainnot voivat korreloida keskenään rypäiden sisällä Korreloituneisuuteen reagoidaan asetelmaperusteisilla menetelmillä Asetelmaperusteiset piste-estimaatit ja keskivirheet Asetelmaperusteiset tilastolliset testit JY Metodifestivaali Risto Lehtonen Asetelmaperusteinen (design-based) analyysi Ohjelmistot SAS: SURVEY-proseduurit SURVEYMEANS, SURVEYFREQ, SURVEYREG, SURVEYLOGISTIC SPSS: Complex Samples -moduli Stata: SVY-proseduurit Muut: R-funktioita, LISREL, Mplus JY Metodifestivaali Risto Lehtonen

15 Asetelmaperusteinen (design-based) analyysi Kirjallisuutta Chambers R.L. and Skinner C.J. (Eds.) (2004). Analysis of Survey Data. Chichester: Wiley. Lehtonen R. and Pahkinen E. (2004). Practical Methods for Design and Analysis of Complex Surveys. Second Edition. Chichester: Wiley. Luvut 5, 7-9 JY Metodifestivaali Risto Lehtonen Malliperusteinen (model-based) analyysi Mutkikkaan otanta-asetelman ominaisuuksien i i mallinnus Luovutaan iid-oletuksesta Rypäiden sisäkorreloituneisuuteen reagoidaan mallintamalla Kiinteiden tekijöiden mallit ja GEE-estimointi (Generalized Estimating Equations) SAS GENMOD Sekamallit (Mixed models) / Monitasomallit (Multilevel models) SAS (MIXED, GLIMMIX), MLwiN, SPSS/ MIXED, LISREL, Mplus, R function lme, JY Metodifestivaali Risto Lehtonen

16 Malliperusteinen (model-based) analyysi Kirjallisuutta Demidenko E. (2004). Mixed Models. Theory and Applications. New York: Wiley. Diggle P. J., Liang, K.-Y. & Zeger, S. L. (1994). Analysis of Longitudinal Data. Oxford: Oxford University Press. Goldstein H. (2003). Multilevel Statistical Models. 3rd edition. London: Arnold; New York: John Wiley & Sons. JY Metodifestivaali Risto Lehtonen OHC-survey: Frekvenssiaineisto (Lehtonen&Pahkinen 2004) Logit-ANOVA Table 8.2 Proportion p of persons in the upper psychic strain group, with standard error estimates s.e and design-effect estimates deff of the proportions, and ddomain sample sizes n and dthe number of sample clusters m (the OHC Survey). Domain SEX AGE PHYS p s.e deff n m 1 Males Females All JY Metodifestivaali Risto Lehtonen

17 Asetelmaperusteinen analyysi logitmalleilla SAS-proseduuri SURVEYLOGISTIC Logistinen malli: Yleistettyjen lineaaristen mallien perheen jäsen Binäärinen (0 / 1) tulosmuuttuja Moniluokkainen tulosmuuttuja Otanta-asetelman ominaisuudet voidaan ottaa huomioon Ositus STRATA-lause Ryvästys CLUSTER-lause Painotus WEIGHT-lause JY Metodifestivaali Risto Lehtonen Logit ANCOVA, tilastometodinen kuvaus Lehtonen&Pahkinen (2004) 8.4 LOGISTIC AND LINEAR REGRESSION Design-based and Binomial PML Methods Logistic Regression Example 8.2 JY Metodifestivaali Risto Lehtonen

18 TILASTOLLINEN MALLI Logitmalli (logistinen malli) Tulosmuuttuja y alkiolle y k : y k = 1 jos tutkittava ilmiö tapahtuu y = 0 muulloin k Tilastollinen malli: exp( x kβ) Em( yk) = P{ yk = 1} = 1+ exp( x β) k missä x k = (1, x1 k,, x pk) on selittävien muuttujien arvojen vektori alkiolle k β ( β, β,, β ) on estimoitavien parametrien vektori = 0 1 p JY Metodifestivaali Risto Lehtonen ESIMERKKI Kiinteiden tekijöiden logitmalli y k logit( yk) = log = x kβ = β0 + β1x1 k 1 yk missä β 0 on mallin kiinteä vakiotermi (intercept) β on kulmakerroin (slope) 1 Monitasomalli (sekamalli) y k logit( yk u) = log = β0 + u0d + β1x1 k 1 yk missä u 0d on satunnainen vakiotermi (random intercept) JY Metodifestivaali Risto Lehtonen

19 Logitmallin parametrien asetelmaperusteinen estimointi GWLS-estimointi ei-iteratiivinen menetelmä Painotettu PNS Generalized weighted least squares PML-estimointi yleisimmin käytetty menetelmä Pseudo-uskottavuus Pseudo maximum likelihood Iteratiivinen menetelmä SAS/SURVEYLOGISTIC, GENMOD, ym. GEE-estimointi vaihtoehto PML-menetelmälle Yleistetyt estimointiyhtälöt Generalized estimating equations SAS/GENMOD (malliperusteinen) REML-estimointi Sekamalli Restricted (residual) maximum likelihood SAS/ MIXED, R funktio lme, ym. JY Metodifestivaali Risto Lehtonen Asetelmaperusteinen Waldin testisuure ˆ 2 β 2 j Χ des ( β j ) =, j = 1,, p + 1 v ( ˆ β ) des j 2 joka on asymptoottisesti χ -jakautunut vapausastein df=1 Termi ˆj β on estimoitu logit-regressiokerroin (esim. PML) Termi v ( βˆ ) on asetelmaperusteisesti estimoitu varianssi des j (esim. linearisointimenetelmä, jackknife, bootstrap) ˆ β j Vastaava t-testisuure t des( β j ) = s.e ( ˆ des β j ) on Waldin testisuureen merkkinen neliöjuuri JY Metodifestivaali Risto Lehtonen

20 ESIMERKKI Lehtonen&Pahkinen (2004) Example 8.2 Asetelmaperusteinen logistinen ANCOVA OHC Survey Ositettu ryväsotanta-asetelma H= 5 ositetta m= 250 toimipaikkaa (otosryvästä) n = 7841 otoshenkilöä JY Metodifestivaali Risto Lehtonen Muuttujat Binäärinen tulosmuuttuja: PSYCH2 Psyykkinen rasittuneisuus 0: Lievä (alle mediaanin) 1: Vakava (yli mediaanin) Diskreetti selittäjä Sukupuoli SEX (M/F) Jatkuvat selittäjät Ikä AGE (vuosina) Työn fysikaaliset haitat: PHYS (0/1) Pitkäaikaissairastavuus: CHRON (0/1) JY Metodifestivaali Risto Lehtonen

21 Tilastollinen malli Logit-ANCOVA-malli logit(p) = INTERCEPT + SEX + AGE + PHYS + CHRON + SEX*AGE + SEX*PHYS + SEX*CHRON missä P = Prob(Psych2 = 1 X) Tuntematon osuusparametri Todennäköisyys kuulua vakavamman psyykkisen rasittuneisuuden luokkaan JY Metodifestivaali Risto Lehtonen Mallin sovittaminen asetelmaperusteisesti Mallin parametrivektorin estimointi PML-estimointi Pseudolikelihood SAS/SURVEYLOGISTIC Lopullinen redusoitu malli: logit(p) = INTERCEPT + SEX + AGE + PHYS + CHRON + SEX*AGE JY Metodifestivaali Risto Lehtonen

22 SAS Procedure SURVEYLOGISTIC proc surveylogistic data=ohcjy; title1 "Asetelmaperusteinen: Ryväsotanta-asetelma"; title2 "Sallitaan havaintojen riippuvuus"; strata osite; cluster ryvas; class sex / param=ref; model psych2(event=last)=sex age phys chron sex*age / link=logit rsquare; run; JY Metodifestivaali Risto Lehtonen Lehtonen & Pahkinen (2004) Table 8.8 JY Metodifestivaali Risto Lehtonen

23 Suhteellinen riski Odds Ratio OR Sukupuoli-ikävakioitu suhteellinen riski Odds Ratio, OR (asetelmaperusteinen 95% luottamusväli): OR(PHYS) = 1.32 (1.17, 1.48) OR(CHRON) = 1.76 (1.57, 1.97) JY Metodifestivaali Risto Lehtonen JY Metodifestivaali Risto Lehtonen

24 SAS-demot klo 14:30-16 SAS-koodi: SAS_Demo Asetelmaperusteinen analyysi SAS Procedure SURVEYLOGISTIC Malliperusteinen analyysi SAS Procedure GENMOD SAS Procedure GLIMMIX JY Metodifestivaali Risto Lehtonen VLISS-Virtual Laboratory in Survey Sampling Risto Lehtonen and Erkki Pahkinen (2004). Practical Methods for Design and Analysis of Complex Surveys. Chichester: Wiley. TRAINING KEY 288: Logistic ANCOVA In Training Key 288, logistic analysis of covariance (ANCOVA) is demonstrated for a binary response variable and the results of Example 8.2 are reproduced. Pseudolikelihood (PML) estimation is used for the OHC Survey data set, accounting for the sampling complexities. An option is provided for a detailed examination of the role of interaction effects in a logistic ANCOVA model. JY Metodifestivaali Risto Lehtonen

25 Tilastolliset ohjelmistot: Korreloituneiden aineistojen analyysi Hierarkkisesti rakentunut aineisto Ryväsrakenne Ositerakenne Asetelmaperusteinen analyysi Painomuuttuja Ositusmuuttuja Ryväsmuuttuja Malliperusteinen analyysi Painomuuttuja Ryväsmuuttuja JY Metodifestivaali Risto Lehtonen Tilastollinen ohjelmisto: SAS Asetelmaperusteinen analyysi SURVEY-proseduurit (SAS versio 9) SURVEYMEANS Keskiarvot SURVEYFREQ Ristiintaulukointi Asetelmaperusteiset testit SURVEYREG Lineaarinen regressioanalyysi, ANOVA, ANCOVA SURVEYLOGISTIC Logistiset mallit JY Metodifestivaali Risto Lehtonen

26 Tilastollinen ohjelmisto: SAS Malliperusteinen analyysi Monitasomallien (sekamallien) sovittaminen MIXED - Esimerkki Lineaariset sekamallit GLIMMIX - Esimerkki Yleistetyt lineaariset sekamallit NLMIXED Epälineaariset sekamallit JY Metodifestivaali Risto Lehtonen Tilastollinen ohjelmisto: SPSS Complex samples (SPSS versio 16) Hierarkkinen data Ositettu ryväsotanta Asetelmaperusteinen analyysi Asetelmapainot tai analyysipainot Ositusmuuttuja Ryväsmuuttuja Modulit CSPLAN ja CSSELECT Otoksen poiminta CSDESCRIPTIVES Kuvailevat tunnusluvut CSTABULATE Ristiintaulukointi ja testit CSGLM, CSLOGISTIC Lineaariset ja logistiset mallit 26

27 Tilastollinen ohjelmisto: STATA STATA (versio 10) Hierarkkinen data Ositettu ryväsotanta Asetelmaperusteinen analyysi Analyysipainot Ositusmuuttuja Ryväsmuuttuja SVY-optiot (SurVeY data) Kuvailevat tunnusluvut ja testisuureet Yleistetyt lineaariset mallit Biometrian menetelmiä ja malleja Ekonometrian menetelmiä ja malleja Tilastollinen ohjelmisto: LISREL LISREL 8.7 Win Hierarkkinen data Ositettu ryväsotanta Asetelmaperusteinen analyysi Analyysipainot Ositusmuuttuja tt Ryväsmuuttuja Menetelmät, esimerkiksi: Yleistetyt lineaariset mallit Lineaariset sekamallit 27

28 Tilastollinen ohjelmisto: Mplus Mplus Hierarkkinen data Ositettu ryväsotanta Asetelmaperusteinen analyysi Analyysipainot Ositusmuuttuja tt Ryväsmuuttuja Menetelmät, esimerkiksi: Yleistetyt lineaariset mallit Yleistetyt lineaariset sekamallit 28

Otanta-aineistojen analyysi (78136, 78405) Kevät 2010 TEEMA 3: Frekvenssiaineistojen asetelmaperusteinen analyysi: Perusteita

Otanta-aineistojen analyysi (78136, 78405) Kevät 2010 TEEMA 3: Frekvenssiaineistojen asetelmaperusteinen analyysi: Perusteita Otanta-aineistojen analyysi (78136, 78405) Kevät 2010 TEEMA 3: Frekvenssiaineistojen asetelmaperusteinen analyysi: Perusteita risto.lehtonen@helsinki.fi OHC Survey Tilastollinen analyysi Kysymys: Millä

Lisätiedot

Otanta-aineistojen analyysi (78136, 78405) Kevät 2010 TEEMA 4: Asetelmaperusteinen monimuuttuja-analyysi

Otanta-aineistojen analyysi (78136, 78405) Kevät 2010 TEEMA 4: Asetelmaperusteinen monimuuttuja-analyysi Otanta-aineistojen analyysi (78136, 78405) Kevät 2010 TEEMA 4: Asetelmaperusteinen monimuuttuja-analyysi Risto Lehtonen risto.lehtonen@helsini.fi Analyysimenetelmiä ja työaluja Lineaariset mallit Regressioanalyysi

Lisätiedot

(78143) Syksy 2009 TEEMAT 3 & 4. Risto Lehtonen Teema 3 ERITYISKYSYMYKSIÄ. Risto Lehtonen 2

(78143) Syksy 2009 TEEMAT 3 & 4. Risto Lehtonen Teema 3 ERITYISKYSYMYKSIÄ. Risto Lehtonen 2 Otantamenetelmät (78143) Syksy 2009 TEEMAT 3 & 4 Risto Lehtonen risto.lehtonen@helsinki.fi Teema 3 ERITYISKYSYMYKSIÄ Risto Lehtonen 2 1 Otannan erityiskysymyksiä Ryväsotanta Survey sampling reference guidelines

Lisätiedot

Otanta-aineistojen analyysi

Otanta-aineistojen analyysi Otanta-aineistojen analyysi (78136, 78405) Kevät 2010 TEEMA 1 Risto Lehtonen risto.lehtonen@helsinki.fi Otanta-aineistojen analyysi Laajuus 6/8 op. Tyyppi 78136 Otanta-aineistojen analyysi (aineopintojen

Lisätiedot

Otanta-aineistojen analyysi Kevät 2010 TEEMA 5: Tilastollinen mallinnus II Mallit, analyysimenetelmiä ja ohjelmia, PISA-esimerkki

Otanta-aineistojen analyysi Kevät 2010 TEEMA 5: Tilastollinen mallinnus II Mallit, analyysimenetelmiä ja ohjelmia, PISA-esimerkki Otanta-aineistojen analyysi Kevät 2010 TEEMA 5: Tilastollinen mallinnus II Mallit, analyysimenetelmiä ja ohjelmia, PISA-esimerkki risto.lehtonen@helsinki.fi Korreloituneiden havaintojen analyysi Lineaariset

Lisätiedot

Otanta-aineistojen analyysi

Otanta-aineistojen analyysi Helsingin yliopisto Otanta-aineistojen analyysi Kevät 2010 Periodi III Risto Lehtonen Teema 2 Estimaattoreiden varianssien estimointi Survey-analyysin lähestymistavat Kuvaileva survey Descriptive survey

Lisätiedot

Tilastollisten menetelmien käyttö Kelan tutkimustoiminnassa

Tilastollisten menetelmien käyttö Kelan tutkimustoiminnassa Tilastollisten menetelmien käyttö Kelan tutkimustoiminnassa Risto Lehtonen Helsingin yliopisto Kela 1 Tilastokeskuksen SAS-seminaari 16.11.2009 Aiheita Kelan tutkimustoiminta SAS-sovellukset vaativien

Lisätiedot

Otanta-aineistojen analyysi

Otanta-aineistojen analyysi Helsingin yliopisto Otanta-aineistojen analyysi Kevät 2010 Periodi III Risto Lehtonen Teema 4 Asetelmaperusteinen monimuuttujaanalyysi Logistinen ANOVA ja GWLS-estimointi Binäärinen tulosmuuttuja Diskreetit

Lisätiedot

Monitasomallit koulututkimuksessa

Monitasomallit koulututkimuksessa Metodifestivaali 9.5.009 Monitasomallit koulututkimuksessa Mitä ihmettä? Antero Malin Koulutuksen tutkimuslaitos Jyväskylän yliopisto 009 1 Tilastollisten analyysien lähtökohta: Perusjoukolla on luonnollinen

Lisätiedot

JY / METODIFESTIVAALI 2013 PRE-KURSSI: KYSELYTUTKIMUS DEMOT

JY / METODIFESTIVAALI 2013 PRE-KURSSI: KYSELYTUTKIMUS DEMOT JY / METODIFESTIVAALI 2013 PRE-KURSSI: KYSELYTUTKIMUS DEMOT SPSS-ohjelmiston Complex Samples- toiminto otoksen poiminnassa ja estimaattien laskennassa Mauno Keto, lehtori Mikkelin AMK / Liiketalouden laitos

Lisätiedot

ATH-aineiston tilastolliset analyysit SPSS/PASW SPSS analyysit / Risto Sippola 1

ATH-aineiston tilastolliset analyysit SPSS/PASW SPSS analyysit / Risto Sippola 1 ATH-aineiston tilastolliset analyysit SPSS/PASW 16.2.2011 SPSS analyysit / Risto Sippola 1 Aineiston avaaminen Aineisto on saatu SPSS-muotoon ja tallennettu koneelle sijaintiin, josta sitä voidaan käyttää

Lisätiedot

Otanta-aineistojen analyysi

Otanta-aineistojen analyysi Helsingin yliopisto Otanta-aineistojen analyysi Kevät 2010 Periodi III Risto Lehtonen Teema 3 Frekvenssiaineistojen asetelmaperusteinen analyysi: Perusteita Johdattava esimerkki - Yksinkertainen yhteensopivuustesti

Lisätiedot

Regressioanalyysi. Vilkkumaa / Kuusinen 1

Regressioanalyysi. Vilkkumaa / Kuusinen 1 Regressioanalyysi Vilkkumaa / Kuusinen 1 Regressioanalyysin idea ja tavoitteet Regressioanalyysin idea: Halutaan selittää selitettävän muuttujan havaittujen arvojen vaihtelua selittävien muuttujien havaittujen

Lisätiedot

Otantamenetelmät. Syksy

Otantamenetelmät. Syksy Otantamenetelmät (78143) Sysy 2009 TEEMA 2 risto.lehtonen@helsini.fi Teema 2 LISÄTIEDON KÄYTTÖ ESTIMOINTIASETELMASSA: MALLIAVUSTEINEN ESTIMOINTI 2 Lisätiedon äyttö estimointiasetelmassa i t Malliavusteiset

Lisätiedot

Health 2000/2011 Surveys. Statistical Analysis using SAS and SAS-Callable SUDAAN Packages 17.6.2013. Esa Virtala. etunimi.sukunimi@thl.

Health 2000/2011 Surveys. Statistical Analysis using SAS and SAS-Callable SUDAAN Packages 17.6.2013. Esa Virtala. etunimi.sukunimi@thl. Health 2000/2011 Surveys Statistical Analysis using SAS and SAS-Callable SUDAAN Packages 17.6.2013 Esa Virtala etunimi.sukunimi@thl.fi Terveyden ja hyvinvoinnin laitos (THL) PL 30 00271 Helsinki Puhelin:

Lisätiedot

Tommi Härkänen, Teppo Juntunen, Eero Lilja Analyysiohjeita Maahanmuuttajien terveys- ja hyvinvointitutkimusaineiston käsittelemiseksi.

Tommi Härkänen, Teppo Juntunen, Eero Lilja Analyysiohjeita Maahanmuuttajien terveys- ja hyvinvointitutkimusaineiston käsittelemiseksi. Tommi Härkänen, Teppo Juntunen, Eero Lilja Analyysiohjeita Maahanmuuttajien terveys- ja hyvinvointitutkimusaineiston käsittelemiseksi Taustaa Otoksen ositus kunnittain ja maahanmuuttajaryhmittäin Katso

Lisätiedot

tilastotieteen kertaus

tilastotieteen kertaus tilastotieteen kertaus Keskiviikon 24.1. harjoitukset pidetään poikkeuksellisesti klo 14-16 luokassa Y228. Heliövaara 1 Mitä tilastotiede on? Tilastotiede kehittää ja soveltaa menetelmiä, joiden avulla

Lisätiedot

Perusestimointi 5 Analyysiä survey-datalla Tee Suomen datalla jokin oma kokeilu käyttäen tätä mallia Esimerkki PISA 2006:sta SAS:lla

Perusestimointi 5 Analyysiä survey-datalla Tee Suomen datalla jokin oma kokeilu käyttäen tätä mallia Esimerkki PISA 2006:sta SAS:lla Perusestimointi 5 Analyysiä survey-datalla Tee Suomen datalla jokin oma kokeilu käyttäen tätä mallia Esimerkki PISA 2006:sta SAS:lla proc surveymeans data=pisa.impuoecd; where cnt='fin' or cnt='deu' or

Lisätiedot

Pienalue-estimointi (78189) Kevät 2011 Risto Lehtonen

Pienalue-estimointi (78189) Kevät 2011 Risto Lehtonen Helsingin yliopisto Sosiaalitieteien laitos 1 Pienalue-estimointi (78189) Kevät 2011 Risto Lehtonen OSA 4 Laajennettu GREG-estimaattoreien perhe Avustavat mallit Yleistetty lineaarinen malli Lineaarinen

Lisätiedot

Tilastotieteen aihehakemisto

Tilastotieteen aihehakemisto Tilastotieteen aihehakemisto hakusana ARIMA ARMA autokorrelaatio autokovarianssi autoregressiivinen malli Bayes-verkot, alkeet TILS350 Bayes-tilastotiede 2 Bayes-verkot, kausaalitulkinta bootstrap, alkeet

Lisätiedot

Otantamenetelmät (78143) Syksy 2008 OSA 2: Malliavusteinen estimointi. Risto Lehtonen

Otantamenetelmät (78143) Syksy 2008 OSA 2: Malliavusteinen estimointi. Risto Lehtonen Otantamenetelmät (78143) Sysy 2008 OSA 2: Malliavusteinen estimointi Risto Lehtonen risto.lehtonen@helsini.fi Lisätiedon äyttö estimointiasetelmassa Tavoitteena estimoinnin tehostaminen poimitulle otoselle

Lisätiedot

Jakaumien merkitys biologisissa havaintoaineistoissa: Löytyykö ratkaisu Yleistetyistä Lineaarisista (Seka)Malleista?

Jakaumien merkitys biologisissa havaintoaineistoissa: Löytyykö ratkaisu Yleistetyistä Lineaarisista (Seka)Malleista? 1 Hydrobiologian tutkijaseminaari 20.3.2000 Jakaumien merkitys biologisissa havaintoaineistoissa: Löytyykö ratkaisu Yleistetyistä Lineaarisista (Seka)Malleista? Jari Hänninen Turun yliopisto Saaristomeren

Lisätiedot

Harha mallin arvioinnissa

Harha mallin arvioinnissa Esitelmä 12 Antti Toppila sivu 1/18 Optimointiopin seminaari Syksy 2010 Harha mallin arvioinnissa Antti Toppila 13.10.2010 Esitelmä 12 Antti Toppila sivu 2/18 Optimointiopin seminaari Syksy 2010 Sisältö

Lisätiedot

Tilastotieteen kertaus. Kuusinen/Heliövaara 1

Tilastotieteen kertaus. Kuusinen/Heliövaara 1 Tilastotieteen kertaus Kuusinen/Heliövaara 1 Mitä tilastotiede on? Tilastotiede kehittää ja soveltaa menetelmiä, joiden avulla reaalimaailman ilmiöistä voidaan tehdä johtopäätöksiä tilanteissa, joissa

Lisätiedot

Regressioanalyysi. Kuusinen/Heliövaara 1

Regressioanalyysi. Kuusinen/Heliövaara 1 Regressioanalyysi Kuusinen/Heliövaara 1 Regressioanalyysin idea ja tavoitteet Regressioanalyysin idea: Oletetaan, että haluamme selittää jonkin selitettävän muuttujan havaittujen arvojen vaihtelun joidenkin

Lisätiedot

Epävarmuuden hallinta bootstrap-menetelmillä

Epävarmuuden hallinta bootstrap-menetelmillä 1/17 Epävarmuuden hallinta bootstrap-menetelmillä Esimerkkinä taloudellinen arviointi Jaakko Nevalainen Tampereen yliopisto Metodifestivaalit 2015 2/17 Sisältö 1 Johdanto 2 Tavanomainen bootstrap Bootstrap-menettelyn

Lisätiedot

Tilastollinen aineisto Luottamusväli

Tilastollinen aineisto Luottamusväli Tilastollinen aineisto Luottamusväli Keijo Ruotsalainen Oulun yliopisto, Teknillinen tiedekunta Matematiikan jaos Tilastollinen aineisto p.1/20 Johdanto Kokeellisessa tutkimuksessa tutkittavien suureiden

Lisätiedot

ATH-koulutus: Stata 11 THL ATH-koulutus / Tommi Härkänen 1

ATH-koulutus: Stata 11 THL ATH-koulutus / Tommi Härkänen 1 ATH-koulutus: Stata 11 THL 16.2.2011 16. 2. 2011 ATH-koulutus / Tommi Härkänen 1 Sisältö Otanta-asetelman kuvaaminen Stata 11:llä Perustunnusluvut Regressioanalyysit Mallivakiointi 16. 2. 2011 ATH-koulutus

Lisätiedot

Parametrin estimointi ja bootstrap-otanta

Parametrin estimointi ja bootstrap-otanta Parametrin estimointi ja bootstrap-otanta Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo Tutkimustiedonhallinnan peruskurssi Parametrin estimointi ja bootstrap-otanta 1/27 Kevät 2003 Käytännön asioista

Lisätiedot

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1 Tilastotieteen kertaus Vilkkumaa / Kuusinen 1 Motivointi Reaalimaailman ilmiöihin liittyy tyypillisesti satunnaisuutta ja epävarmuutta Ilmiöihin liittyvien havaintojen ajatellaan usein olevan peräisin

Lisätiedot

Lumipallo regressioanalyysista. Logistinen regressioanalyysi. Soveltuvan menetelmän valinta. Regressioanalyysi. Logistinen regressioanalyysi I

Lumipallo regressioanalyysista. Logistinen regressioanalyysi. Soveltuvan menetelmän valinta. Regressioanalyysi. Logistinen regressioanalyysi I Lumipallo regressioanalyysista jokainen kirjoittaa lapulle yhden lauseen regressioanalyysista ja antaa sen seuraavalle Logistinen regressioanalyysi Y250. Kvantitatiiviset menetelmät (6 op) Hanna Wass tutkijatohtori

Lisätiedot

Yleistetyistä lineaarisista malleista

Yleistetyistä lineaarisista malleista Yleistetyistä lineaarisista malleista Tilastotiede käytännön tutkimuksessa -kurssi, kesä 2001 Reijo Sund Klassinen lineaarinen malli y = Xb + e eli E(Y) = m, jossa m = Xb Satunnaiskomponentti: Y:n komponentit

Lisätiedot

Liite artikkeliin Intohimo tasa-arvoon

Liite artikkeliin Intohimo tasa-arvoon Liite artikkeliin Intohimo tasa-arvoon Menetelmäkuvaus Artikkelissa käytetty regressiomalli on ns. binäärinen logistinen monitasoregressiomalli. Monitasoanalyysien ideana on se, että yksilöiden vastauksiin

Lisätiedot

805306A Johdatus monimuuttujamenetelmiin, 5 op

805306A Johdatus monimuuttujamenetelmiin, 5 op monimuuttujamenetelmiin, 5 op syksy 2018 Matemaattisten tieteiden laitos Logistinen regressioanalyysi Vastemuuttuja Y on luokiteltu muuttuja Pyritään mallittamaan havaintoyksikön todennäköisyyttä kuulua

Lisätiedot

SAS/IML käyttö ekonometristen mallien tilastollisessa päättelyssä. Antti Suoperä 16.11.2009

SAS/IML käyttö ekonometristen mallien tilastollisessa päättelyssä. Antti Suoperä 16.11.2009 SAS/IML käyttö ekonometristen mallien tilastollisessa päättelyssä Antti Suoperä 16.11.2009 SAS/IML käyttö ekonometristen mallien tilastollisessa päättelyssä: Matriisi ja vektori laskennan ohjelmisto edellyttää

Lisätiedot

Pienalue-estimointi (78189) Kevät 2011. Risto Lehtonen Helsingin yliopisto

Pienalue-estimointi (78189) Kevät 2011. Risto Lehtonen Helsingin yliopisto Pienalue-estimointi (78189) Kevät 2011 Risto Lehtonen Helsingin yliopisto Pienalue-estimointi Kurssin kotisivu http://wiki.helsinki.fi/pages/viewpage.action?pagei=62430039 2 Hyöyllisiä taustatietoja Otantamenetelmät

Lisätiedot

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme? TKK (c) Ilkka Mellin (2004) 1 Johdatus tilastotieteeseen TKK (c) Ilkka Mellin (2004) 2 Mitä opimme? 1/4 Tilastollisen tutkimuksen tavoitteena on tehdä johtopäätöksiä prosesseista, jotka generoivat reaalimaailman

Lisätiedot

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1 Johdatus tilastotieteeseen Estimointi TKK (c) Ilkka Mellin (2005) 1 Estimointi Todennäköisyysjakaumien parametrit ja niiden estimointi Hyvän estimaattorin ominaisuudet TKK (c) Ilkka Mellin (2005) 2 Estimointi:

Lisätiedot

ABHELSINKI UNIVERSITY OF TECHNOLOGY

ABHELSINKI UNIVERSITY OF TECHNOLOGY Johdatus regressioanalyysiin Regressioanalyysin idea Oletetaan, että haluamme selittää jonkin selitettävän muuttujan havaittujen arvojen vaihtelun selittävien muuttujien havaittujen arvojen vaihtelun avulla.

Lisätiedot

Teema 8: Parametrien estimointi ja luottamusvälit

Teema 8: Parametrien estimointi ja luottamusvälit Teema 8: Parametrien estimointi ja luottamusvälit Todennäköisyyslaskennan perusteet (Teemat 6 ja 7) antavat hyvän pohjan siirtyä kurssin viimeiseen laajempaan kokonaisuuteen, nimittäin tilastolliseen päättelyyn.

Lisätiedot

TA7, Ekonometrian johdantokurssi HARJOITUS 4 1 RATKAISUEHDOTUKSET

TA7, Ekonometrian johdantokurssi HARJOITUS 4 1 RATKAISUEHDOTUKSET TA7, Ekonometrian johdantokurssi HARJOITUS 4 1 RATKAISUEHDOTUKSET 16..015 1. a Poliisivoimien suuruuden lisäksi piirikuntien rikostilastoihin vaikuttaa monet muutkin tekijät. Esimerkiksi asukkaiden keskimääräinen

Lisätiedot

Estimaattoreiden asetelmaperusteinen

Estimaattoreiden asetelmaperusteinen Otanta-aineistojen aineistojen analyysi (78136, 78405) Kevät 2010 TEEMA 2: Estimaattoreiden varianssin estimointi Risto Lehtonen risto.lehtonen@helsinki.fi Estimaattoreiden asetelmaperusteinen varianssien

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 22. marraskuuta 2007 Antti Rasila () TodB 22. marraskuuta 2007 1 / 17 1 Epäparametrisia testejä (jatkoa) χ 2 -riippumattomuustesti 2 Johdatus regressioanalyysiin

Lisätiedot

Mat Tilastollisen analyysin perusteet, kevät 2007

Mat Tilastollisen analyysin perusteet, kevät 2007 Mat-.104 Tilastollisen analyysin perusteet, kevät 007 8. luento: Usean selittäjän lineaarinen regressiomalli Kai Virtanen 1 Usean selittäjän lineaarinen regressiomalli Selitettävän muuttujan havaittujen

Lisätiedot

A250A0050 Ekonometrian perusteet Tentti

A250A0050 Ekonometrian perusteet Tentti A250A0050 Ekonometrian perusteet Tentti 28.9.2016 Tentissä ei saa käyttää laskinta. Tentistä saa max 80 pistettä. Hyväksytysti suoritetusta harjoitustyöstä saa max 20 pistettä. Huom. Merkitse vastauspaperin

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 30. lokakuuta 2007 Antti Rasila () TodB 30. lokakuuta 2007 1 / 23 1 Otos ja otosjakaumat (jatkoa) Frekvenssi ja suhteellinen frekvenssi Frekvenssien odotusarvo

Lisätiedot

Harjoitus 9: Excel - Tilastollinen analyysi

Harjoitus 9: Excel - Tilastollinen analyysi Harjoitus 9: Excel - Tilastollinen analyysi Mat-2.2107 Sovelletun matematiikan tietokonetyöt Syksy 2006 Mat-2.2107 Sovelletun matematiikan tietokonetyöt 1 Harjoituksen aiheita Tutustuminen regressioanalyysiin

Lisätiedot

Testit laatueroasteikollisille muuttujille

Testit laatueroasteikollisille muuttujille Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Testit laatueroasteikollisille muuttujille TKK (c) Ilkka Mellin (2007) 1 Testit laatueroasteikollisille muuttujille >> Laatueroasteikollisten

Lisätiedot

pitkittäisaineistoissa

pitkittäisaineistoissa Puuttuvan tiedon ongelma p. 1/18 Puuttuvan tiedon ongelma pitkittäisaineistoissa Tapio Nummi tan@uta.fi Matematiikan, tilastotieteen ja filosofian laitos Tampereen yliopisto mtl.uta.fi/tilasto/sekamallit/puupitkit.pdf

Lisätiedot

54. Tehdään yhden selittäjän lineaarinen regressioanalyysi, kun selittäjänä on määrällinen muuttuja (ja selitettävä myös):

54. Tehdään yhden selittäjän lineaarinen regressioanalyysi, kun selittäjänä on määrällinen muuttuja (ja selitettävä myös): Tilastollinen tietojenkäsittely / SPSS Harjoitus 5 Tarkastellaan ensin aineistoa KUNNAT. Kyseessähän on siis kokonaistutkimusaineisto, joten tilastollisia testejä ja niiden merkitsevyystarkasteluja ei

Lisätiedot

Esim Brand lkm keskiarvo keskihajonta A ,28 5,977 B ,06 3,866 C ,95 4,501

Esim Brand lkm keskiarvo keskihajonta A ,28 5,977 B ,06 3,866 C ,95 4,501 Esim. 2.1.1. Brand lkm keskiarvo keskihajonta A 10 251,28 5,977 B 10 261,06 3,866 C 10 269,95 4,501 y = 260, 76, n = 30 SS 1 = (n 1 1)s 2 1 = (10 1)5, 977 2 321, 52 SS 2 = (n 2 1)s 2 2 = (10 1)3, 8662

Lisätiedot

Load

Load Tampereen yliopisto Tilastollinen mallintaminen Mikko Alivuotila ja Anne Puustelli Lentokoneiden rakennuksessa käytettävien metallinkiinnittimien puristuskestävyys Matematiikan, tilastotieteen ja filosofian

Lisätiedot

KLIINISTEN TUTKIMUSTEN SUUNNITTELU JA KOEASETELMAT. Vesa Kiviniemi (FL) Itä-Suomen yliopisto

KLIINISTEN TUTKIMUSTEN SUUNNITTELU JA KOEASETELMAT. Vesa Kiviniemi (FL) Itä-Suomen yliopisto KLIINISTEN TUTKIMUSTEN SUUNNITTELU JA KOEASETELMAT Vesa Kiviniemi (FL) Itä-Suomen yliopisto 13.4.2010 SISÄLTÖ 1 Kokeellisen tutkimuksen tutkimustyypit 2 Kohdepopulaatio ja potilaiden valinta 3 Vertailuryhmän

Lisätiedot

Pienalue-estimointi (78189) Kevät 2011 Risto Lehtonen

Pienalue-estimointi (78189) Kevät 2011 Risto Lehtonen Helsingin yliopisto Sosiaalitieteien laitos 1 Pienalue-estimointi (78189) Kevät 2011 Risto Lehtonen OSA 3 GREG-estimaattori Yleinen tilanne (unequal probability sampling) Komposiittiestimaattorit (Composite

Lisätiedot

[MTTTA] TILASTOMENETELMIEN PERUSTEET, KEVÄT 209 https://coursepages.uta.fi/mttta/kevat-209/ HARJOITUS 5 viikko 8 RYHMÄT: ke 2.5 3.45 ls. C6 Leppälä to 08.30 0.00 ls. C6 Korhonen to 2.5 3.45 ls. C6 Korhonen

Lisätiedot

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta Tilastollisen analyysin perusteet Luento 1: ja hajonta Sisältö Havaittujen arvojen jakauma Havaittujen arvojen jakaumaa voidaan kuvailla ja esitellä tiivistämällä havaintoarvot sopivaan muotoon. Jakauman

Lisätiedot

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012 Timo Törmäkangas Itse arvioidun terveydentilan ja sukupuolen välinen riippuvuustarkastelu. Jyväskyläläiset 75-vuotiaat miehet ja naiset vuonna 1989.

Lisätiedot

ATH-koulutus: R ja survey-kirjasto THL 16.2.2011. 16. 2. 2011 ATH-koulutus / Tommi Härkänen 1

ATH-koulutus: R ja survey-kirjasto THL 16.2.2011. 16. 2. 2011 ATH-koulutus / Tommi Härkänen 1 ATH-koulutus: R ja survey-kirjasto THL 16.2.2011 16. 2. 2011 ATH-koulutus / Tommi Härkänen 1 Sisältö Otanta-asetelman kuvaaminen R:llä ja survey-kirjastolla Perustunnusluvut Regressioanalyysit 16. 2. 2011

Lisätiedot

805306A Johdatus monimuuttujamenetelmiin, 5 op

805306A Johdatus monimuuttujamenetelmiin, 5 op monimuuttujamenetelmiin, 5 op syksy 2018 Matemaattisten tieteiden laitos Lineaarinen erotteluanalyysi (LDA, Linear discriminant analysis) Erotteluanalyysin avulla pyritään muodostamaan selittävistä muuttujista

Lisätiedot

Mat Tilastollisen analyysin perusteet, kevät 2007

Mat Tilastollisen analyysin perusteet, kevät 2007 Mat-.14 Tilastollisen analyysin perusteet, kevät 7 7. luento: Tarina yhden selittään lineaarisesta regressiomallista atkuu Kai Virtanen 1 Luennolla 6 opittua Kuvataan havainnot (y, x ) yhden selittään

Lisätiedot

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin Tilastollisen analyysin perusteet Luento 10: Sisältö Varianssianalyysi Varianssianalyysi on kahden riippumattoman otoksen t testin yleistys. Varianssianalyysissä perusjoukko koostuu kahdesta tai useammasta

Lisätiedot

Johdatus regressioanalyysiin. Heliövaara 1

Johdatus regressioanalyysiin. Heliövaara 1 Johdatus regressioanalyysiin Heliövaara 1 Regressioanalyysin idea Oletetaan, että haluamme selittää jonkin selitettävän muuttujan havaittujen arvojen vaihtelun selittävien muuttujien havaittujen arvojen

Lisätiedot

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 9. luento. Pertti Palo

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 9. luento. Pertti Palo FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa 9. luento Pertti Palo 22.11.2012 Käytännön asioita Eihän kukaan paikallaolijoista tee 3 op kurssia? 2. seminaarin ilmoittautuminen. 2. harjoitustyön

Lisätiedot

Tilastollisen analyysin perusteet Luento 9: Moniulotteinen lineaarinen. regressio

Tilastollisen analyysin perusteet Luento 9: Moniulotteinen lineaarinen. regressio Tilastollisen analyysin perusteet Luento 9: lineaarinen lineaarinen Sisältö lineaarinen lineaarinen lineaarinen Lineaarinen Oletetaan, että meillä on n kappaletta (x 1, y 1 ), (x 2, y 2 )..., (x n, y n

Lisätiedot

ATH-koulutus THL 16.2.2011. 16. 2. 2011 ATH-koulutus / Tommi Härkänen 1

ATH-koulutus THL 16.2.2011. 16. 2. 2011 ATH-koulutus / Tommi Härkänen 1 ATH-koulutus THL 16.2.2011 16. 2. 2011 ATH-koulutus / Tommi Härkänen 1 Sisältö Otanta-asetelma Ositus ja 75 vuotta täyttäneiden ylipoiminta Painokertoimet Tulosten esittäminen: mallivakiointi Esimerkit

Lisätiedot

Identifiointiprosessi

Identifiointiprosessi Alustavia kokeita Identifiointiprosessi Koesuunnittelu, identifiointikoe Mittaustulosten / datan esikäsittely Ei-parametriset menetelmät: - Transientti-, korrelaatio-, taajuus-, Fourier- ja spektraalianalyysi

Lisätiedot

Pienet ännät tutkimuksessa Tilastollisen analyysin työpaja. Jari Westerholm Niilo Mäki instituutti Jyväskylän yliopisto

Pienet ännät tutkimuksessa Tilastollisen analyysin työpaja. Jari Westerholm Niilo Mäki instituutti Jyväskylän yliopisto Pienet ännät tutkimuksessa Tilastollisen analyysin työpaja Jari Westerholm Niilo Mäki instituutti Jyväskylän yliopisto Luennon sisältö Pienten otoskokojen haasteista Pieni otoskoko Suositeltuja metodeja

Lisätiedot

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 4A Parametrien estimointi Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2016, periodi

Lisätiedot

VARIANSSIANALYYSI ANALYSIS OF VARIANCE

VARIANSSIANALYYSI ANALYSIS OF VARIANCE VARIANSSIANALYYSI ANALYSIS OF VARIANCE 1 Suomalaisten aikuisten pituusjakauma:.8.7.6.5.4.3.2.1 14 15 16 17 18 19 2 21 Jakauma ei ole normaali, sen olettaminen sellaiseksi johtaa virheellisiin päätelmiin.

Lisätiedot

2. Uskottavuus ja informaatio

2. Uskottavuus ja informaatio 2. Uskottavuus ja informaatio Aluksi käsittelemme uskottavuus- ja log-uskottavuusfunktioita Seuraavaksi esittelemme suurimman uskottavuuden estimointimenetelmän Ensi viikolla perehdymme aiheeseen lisääkö

Lisätiedot

Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi

Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi TKK (c) Ilkka Mellin (2006) 1 Estimointi >> Todennäköisyysjakaumien parametrit ja niiden estimointi Hyvän estimaattorin

Lisätiedot

Osa 2: Otokset, otosjakaumat ja estimointi

Osa 2: Otokset, otosjakaumat ja estimointi Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi TKK (c) Ilkka Mellin (2007) 1 Estimointi >> Todennäköisyysjakaumien parametrit ja niiden estimointi Hyvän estimaattorin

Lisätiedot

BOOTSTRAPPING? Jukka Nyblom Jyväskylän yliopisto. Metodifestivaali

BOOTSTRAPPING? Jukka Nyblom Jyväskylän yliopisto. Metodifestivaali BOOTSTRAPPING? Jukka Nyblom Jyväskylän yliopisto Metodifestivaali 28.5.2009 1 1 Mitä ihmettä on bootstrap? Webster: 1. a loop of leather or cloth sewn at the top rear, or sometimes on each side of a boot

Lisätiedot

Väliestimointi (jatkoa) Heliövaara 1

Väliestimointi (jatkoa) Heliövaara 1 Väliestimointi (jatkoa) Heliövaara 1 Bernoulli-jakauman odotusarvon luottamusväli 1/2 Olkoon havainnot X 1,..., X n yksinkertainen satunnaisotos Bernoulli-jakaumasta parametrilla p. Eli X Bernoulli(p).

Lisätiedot

Mitä tarvitsee tietää biostatistiikasta ja miksi? Matti Uhari Lastentautien klinikka Oulun yliopisto

Mitä tarvitsee tietää biostatistiikasta ja miksi? Matti Uhari Lastentautien klinikka Oulun yliopisto Mitä tarvitsee tietää biostatistiikasta ja miksi? Matti Uhari Lastentautien klinikka Oulun yliopisto Tutkimusaineistomme otantoja Hyödyt Ei tarvitse tutkia kaikkia Oikein tehty otanta mahdollistaa yleistämisen

Lisätiedot

031021P Tilastomatematiikka (5 op) kertausta 2. vk:een

031021P Tilastomatematiikka (5 op) kertausta 2. vk:een 031021P Tilastomatematiikka (5 op) kertausta 2. vk:een Jukka Kemppainen Mathematics Division 2. välikokeeseen Toinen välikoe on la 5.4.2014 klo. 9.00-12.00 saleissa L1,L3 Koealue: luentojen luvut 7-11

Lisätiedot

Estimointi. Vilkkumaa / Kuusinen 1

Estimointi. Vilkkumaa / Kuusinen 1 Estimointi Vilkkumaa / Kuusinen 1 Motivointi Tilastollisessa tutkimuksessa oletetaan jonkin jakauman generoineen tutkimuksen kohteena olevaa ilmiötä koskevat havainnot Tämän mallina käytettävän todennäköisyysjakauman

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 18. lokakuuta 2007 Antti Rasila () TodB 18. lokakuuta 2007 1 / 19 1 Tilastollinen aineisto 2 Tilastollinen malli Yksinkertainen satunnaisotos 3 Otostunnusluvut

Lisätiedot

HAVAITUT JA ODOTETUT FREKVENSSIT

HAVAITUT JA ODOTETUT FREKVENSSIT HAVAITUT JA ODOTETUT FREKVENSSIT F: E: Usein Harvoin Ei tupakoi Yhteensä (1) (2) (3) Mies (1) 59 28 4 91 Nainen (2) 5 14 174 193 Yhteensä 64 42 178 284 Usein Harvoin Ei tupakoi Yhteensä (1) (2) (3) Mies

Lisätiedot

Perhevapaiden palkkavaikutukset

Perhevapaiden palkkavaikutukset Perhevapaiden palkkavaikutukset Perhe ja ura tasa-arvon haasteena seminaari, Helsinki 20.11.2007 Jenni Kellokumpu Esityksen runko 1. Tutkimuksen tavoite 2. Teoria 3. Aineisto, tutkimusasetelma ja otos

Lisätiedot

OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi. Luento 3

OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi. Luento 3 OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi Luento 3 Tutkimussuunnitelman rakenne-ehdotus Otsikko 1. Motivaatio/tausta 2. Tutkimusaihe/ -tavoitteet ja kysymykset

Lisätiedot

Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1 Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille TKK (c) Ilkka Mellin (2004) 1 Testit laatueroasteikollisille muuttujille Laatueroasteikollisten muuttujien testit Testi suhteelliselle

Lisätiedot

Erityiskysymyksiä yleisen lineaarisen mallin soveltamisessa

Erityiskysymyksiä yleisen lineaarisen mallin soveltamisessa Ilkka Mellin Tilastolliset menetelmät Osa 4: Lineaarinen regressioanalyysi Erityiskysymyksiä yleisen lineaarisen mallin soveltamisessa TKK (c) Ilkka Mellin (2007) 1 Erityiskysymyksiä yleisen lineaarisen

Lisätiedot

MS-C2128 Ennustaminen ja Aikasarja-analyysi, 5 op Esittely

MS-C2128 Ennustaminen ja Aikasarja-analyysi, 5 op Esittely MS-C2128 Ennustaminen ja Aikasarja-analyysi, 5 op Esittely Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2017 Aikataulu ja suoritustapa (Katso MyCourses) Luennot

Lisätiedot

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas TUTKIMUSAINEISTON ANALYYSI LTKY012 Timo Törmäkangas JAKAUMAN MUOTO Vinous, skew (g 1, γ 1 ) Kertoo jakauman symmetrisyydestä Vertailuarvona on nolla, joka vastaa symmetristä jakaumaa (mm. normaalijakauma)

Lisätiedot

MS-C2128 Ennustaminen ja Aikasarja-analyysi, 5 op Esittely

MS-C2128 Ennustaminen ja Aikasarja-analyysi, 5 op Esittely MS-C2128 Ennustaminen ja Aikasarja-analyysi, 5 op Esittely Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2015 Aikataulu ja suoritustapa (Katso MyCourses) Luennot

Lisätiedot

Tutkimustiedonhallinnan peruskurssi

Tutkimustiedonhallinnan peruskurssi Tutkimustiedonhallinnan peruskurssi Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo hannu.toivonen, marko.salmenkivi, inkeri.verkamo@cs.helsinki.fi Helsingin yliopisto Hannu Toivonen, Marko Salmenkivi,

Lisätiedot

Otoskoon arviointi. Tero Vahlberg

Otoskoon arviointi. Tero Vahlberg Otoskoon arviointi Tero Vahlberg Otoskoon arviointi Otoskoon arviointi (sample size calculation) ja tutkimuksen voima-analyysi (power analysis) ovat tilastollisen tutkimuksen suunnittelussa keskeisiä kysymyksiä

Lisätiedot

Johdatus tilastotieteeseen Väliestimointi. TKK (c) Ilkka Mellin (2005) 1

Johdatus tilastotieteeseen Väliestimointi. TKK (c) Ilkka Mellin (2005) 1 Johdatus tilastotieteeseen Väliestimointi TKK (c) Ilkka Mellin (2005) 1 Väliestimointi Todennäköisyysjakaumien parametrien estimointi Luottamusväli Normaalijakauman odotusarvon luottamusväli Normaalijakauman

Lisätiedot

Harjoitukset 2 : Monimuuttujaregressio (Palautus )

Harjoitukset 2 : Monimuuttujaregressio (Palautus ) 31C99904, Capstone: Ekonometria ja data-analyysi TA : markku.siikanen(a)aalto.fi & tuuli.vanhapelto(a)aalto.fi Harjoitukset 2 : Monimuuttujaregressio (Palautus 24.1.2017) Tämän harjoituskerran tarkoitus

Lisätiedot

Identifiointiprosessi

Identifiointiprosessi Alustavia kokeita Identifiointiprosessi Koesuunnittelu, identifiointikoe Mittaustulosten / datan esikäsittely Ei-parametriset menetelmät: - Transientti-, korrelaatio-, taajuus-, Fourier- ja spektraalianalyysi

Lisätiedot

TUTKIMUSOPAS. SPSS-opas

TUTKIMUSOPAS. SPSS-opas TUTKIMUSOPAS SPSS-opas Johdanto Tässä oppaassa esitetään SPSS-tilasto-ohjelman alkeita, kuten Excel-tiedoston avaaminen, tunnuslukujen laskeminen ja uusien muuttujien muodostaminen. Lisäksi esitetään esimerkkien

Lisätiedot

Perusnäkymä yksisuuntaiseen ANOVAaan

Perusnäkymä yksisuuntaiseen ANOVAaan Metsämuuronen 2006. TTP Tutkimuksen tekemisen perusteet ihmistieteissä Taulukko.51.1 Analyysiin mukaan tulevat muuttujat Mja selite Merkitys mallissa F1 Ensimmäinen faktoripistemuuttuja Selitettävä muuttuja

Lisätiedot

1. PÄÄTTELY YHDEN SELITTÄJÄN LINEAARISESTA REGRESSIOMALLISTA

1. PÄÄTTELY YHDEN SELITTÄJÄN LINEAARISESTA REGRESSIOMALLISTA Mat-2.104 Tilastollisen analyysin perusteet / Ratkaisut Aiheet: Avainsanat Päättely yhden selittäjän lineaarisesta regressiomallista Ennustaminen, Ennuste, Ennusteen luottamusväli, Estimaatti, Estimaattori,

Lisätiedot

1. Tilastollinen malli??

1. Tilastollinen malli?? 1. Tilastollinen malli?? https://fi.wikipedia.org/wiki/tilastollinen_malli https://en.wikipedia.org/wiki/statistical_model http://projecteuclid.org/euclid.aos/1035844977 Tilastollinen malli?? Numeerinen

Lisätiedot

Logistinen regressio, separoivat hypertasot

Logistinen regressio, separoivat hypertasot Logistinen regressio, separoivat hypertasot Topi Sikanen Logistinen regressio Aineisto jakautunut K luokkaan K=2 tärkeä erikoistapaus Halutaan mallintaa luokkien vedonlyöntikertoimia (odds) havaintojen

Lisätiedot

1. Tutkitaan tavallista kahden selittäjän regressiomallia

1. Tutkitaan tavallista kahden selittäjän regressiomallia TA7, Ekonometrian johdantokurssi HARJOITUS 5 RATKAISUEHDOTUKSET 232215 1 Tutkitaan tavallista kahden selittäjän regressiomallia Y i = β + β 1 X 1,i + β 2 X 2,i + u i (a) Kirjoita regressiomalli muodossa

Lisätiedot

Kertaus. MS-C2128 Ennustaminen ja Aikasarja-analyysi, Heikki Seppälä

Kertaus. MS-C2128 Ennustaminen ja Aikasarja-analyysi, Heikki Seppälä MS-C2128 Ennustaminen ja Aikasarja-analyysi, Heikki Seppälä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2015 Viikko 1: Yleinen lineaarinen malli 1 Määritelmä

Lisätiedot

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta Tilastollisen analyysin perusteet Luento 1: ja hajonta Sisältö Havaittujen arvojen jakauma Havaittujen arvojen jakaumaa voidaan kuvailla ja esitellä tiivistämällä havaintoarvot sopivaan muotoon. Jakauman

Lisätiedot

Tässä harjoituksessa käydään läpi R-ohjelman käyttöä esimerkkidatan avulla. eli matriisissa on 200 riviä (havainnot) ja 7 saraketta (mittaus-arvot)

Tässä harjoituksessa käydään läpi R-ohjelman käyttöä esimerkkidatan avulla. eli matriisissa on 200 riviä (havainnot) ja 7 saraketta (mittaus-arvot) R-ohjelman käyttö data-analyysissä Panu Somervuo 2014 Tässä harjoituksessa käydään läpi R-ohjelman käyttöä esimerkkidatan avulla. 0) käynnistetään R-ohjelma Huom.1 allaolevissa ohjeissa '>' merkki on R:n

Lisätiedot