Hierarkkisen aineiston mallintaminen ja otanta/pre-kurssi
|
|
- Jutta Ahola
- 7 vuotta sitten
- Katselukertoja:
Transkriptio
1 Hierarkkisen aineiston mallintaminen ja otanta/pre-kurssi Risto Lehtonen, Helsingin yliopisto Metodifestivaali Jyväskylän yliopisto Keskiviikko Hierarkkisuus otanta- asetelmaperusteisessa analyysissa Lounastauko Esimerkkianalyyseja Kahvitauko PC-harjoitukset SAS- ja R-ohjelmistoilla JY Metodifestivaali Risto Lehtonen
2 Hierarkkisen aineiston mallintaminen ja otanta/pre-kurssi Kurssilla käsitellään hierarkkisen (tai monitasoisen) tutkimusaineiston tilastollista mallintamista ja otantaa. Kun tutkimusaineistossa on havaintoyksiköitä ryhmittelevä luonnollinen rakenne eikä havaintoyksiköiden riippumattomuusoletus ole voimassa, on tämä otettava huomioon tilastollisessa mallintamisessa. Muuten vaarana on, että analyysitulokset sekä niistä tehtävät sisällölliset tulkinnat ja johtopäätökset ovat virheellisiä. JY Metodifestivaali Risto Lehtonen Hierarkkisen aineiston mallintaminen ja otanta/pre-kurssi Monitasomalli sisältää sekä aineiston rakenteen että havaintoyksiköiden keskinäisen riippuvuuden. Monitasomalli voi sisältää sekä ryhmä- että yksilötason selittäjiä. Kurssin suoritus: luennot, harjoitukset ja erikseen sovittava tehtävä JY Metodifestivaali Risto Lehtonen
3 Käsiteltäviä asioita Terminologiaa Havaintojen keskinäisen riippuvuuden lähteitä Korreloituneisuuteen reagointi analyysissa Tilastollisen analyysin tyylilajit Analyysimenetelmiä, ja sovelluksia Huomioita tilastollisista ohjelmistoista JY Metodifestivaali Risto Lehtonen Terminologiaa Hierarkkisesti rakentunut aineisto Havaintojen korreloituneisuus Correlated data, Dependent data Clustered data, Cluster correlated data Autokorrelaatio Aikadimensio Spatiaalinen korrelaatio Tiladimensio Sisäkorrelaatio Ryhmän sisäinen korrelaatio Hierarkkinen malli Hierarchical model Monitasomalli Multilevel model Sekamalli Mixed model 3
4 OHC Survey Kaksitasoinen hierarkkinen rakenne Kaksiasteinen ryväsotanta: Perusjoukot Toimipaikka TMP-PJ 1 Toimipaikka 2 Toimipaikka M Työntekijä 11 Työntekijä 21 Työntekijä M1 Työntekijä 12 Työntekijä 22 Työntekijä M2 HENKILÖ- PJ Työntekijä 2j.Työntekijä Mj JY Metodifestivaali Risto Lehtonen OHC Survey Kaksitasoinen hierarkkinen rakenne Kaksiasteinen ryväsotanta: Poimittu otos TMP- OTOS Toimipaikka 2 Toimipaikka M Työntekijä 22 Työntekijä M2 Työntekijä 2j.Työntekijä Mj HENKILÖ- OTOS JY Metodifestivaali Risto Lehtonen
5 Havaintojen korreloituneisuuden lähteitä: Tutkimusasetelma ja otanta-asetelma 1. Alkiotason otanta Tutkimusasetelma a. Poikkileikkaus b. Pitkittäisasetelma asetelma 2. Ryväsotanta JY Metodifestivaali Risto Lehtonen Havaintojen korreloituneisuuden lähteitä: Tutkimusasetelma ja otanta-asetelma Otantaasetelma Tutkimusasetelma Otanta a. Poikkileikkaus b. Pitkittäisasetelma asetelma asetelma 1. Alkiotason otanta 1a. Ei havaintojen korreloituneisuutta 2. Ryväsotanta JY Metodifestivaali Risto Lehtonen
6 Havaintojen korreloituneisuuden lähteitä: Tutkimusasetelma ja otanta-asetelma 2. Ryväsotanta 2a. Positiivinen rypäänsisäinen korrelaatio JY Metodifestivaali Risto Lehtonen Havaintojen korreloituneisuuden lähteitä: Tutkimusasetelma ja otanta-asetelma Tutkimusasetelma Otanta a. Poikkileikkaus b. Pitkittäisasetelma asetelma asetelma 1. Alkiotason otanta 1a. Ei havaintojen korreloituneisuutta Tutkimusasetelma Otanta a. Poikkileikkaus b. Pitkittäisasetelma asetelma asetelma 1. Alkiotason otanta 1a. Ei havaintojen korreloituneisuutta 1b. Positiivinen autokorrelaatio 2. Ryväsotanta 2a. Positiivinen rypäänsisäinen korrelaatio JY Metodifestivaali Risto Lehtonen
7 Havaintojen korreloituneisuuden lähteitä: Tutkimusasetelma ja otanta-asetelma 2. Ryväsotanta 2a. Positiivinen rypäänsisäinen korrelaatio 2b. Ristikkäinen autokorrelaatio ja ryväskorrelaatio äk JY Metodifestivaali Risto Lehtonen Esimerkkejä hierarkkisesti rakentuneista tutkimusaineistoista Terveys 2000 PISA Terveyskeskuspiiri Poikkileikkaus 2-asteinen ositettu ryväsotanta 1-asteinen ositettu ryväsotanta ECHP Paneeli 1-asteinen ositettu tt ryväsotanta OHC Survey 2-asteinen ositettu ryväsotanta Poikkileikkaus Koulu tai opetusryhmä Koti- talous Tutkimusasetelma Otanta a. Poikkileikkaus b. Pitkittäisasetelma asetelma asetelma 1. Alkiotason otanta 1a. Ei havaintojen korreloituneisuutta 1b. Positiivinen autokorrelaatio Tutkimusaineisto Tutkimusasetelma Otantaasetelma Ryväsrakenne Havaintoyksikkö Henkilö Oppilas Koti- talouden jäsen Poikkileikkaus Toimipaikka Työntekijä JY Metodifestivaali Risto Lehtonen
8 Esimerkkiaineisto: Työterveyshuoltotutkimus Occupational Health Care Survey OHC Survey Tutkimusasetelma: Poikkileikkaustutkimus Otanta-asetelma Ositettu yksi- ja kaksiasteinen ryväsotanta Toimipaikat rypäinä Ositus rypään koon ja toimialan mukaan Pienet toimipaikat: Yksiasteinen otanta Suuret toimipaikat: Kaksiasteinen otanta Henkilötasolla itsepainottuva (self-weighting) otos Havaintojen riippuvuus: Rypäiden positiivinen sisäkorrelaatio JY Metodifestivaali Risto Lehtonen Esimerkkiaineisto: Työterveyshuoltotutkimus Occupational Health Care Survey OHC Survey Demonstraatioaineisto SAS-data OHCjy Rajaus Toimipaikat, joissa vähintään 10 työntekijää H = 5 ositetta (strata) m = 250 toimipaikkaa (ryvästä, clusters) ) n = 7841 henkilöä Vaihteleva määrä otosrypäitä per osite JY Metodifestivaali Risto Lehtonen
9 OHC Survey SAS data OHCjy: Muuttujaluettelo Variables in Creation Order # Variable Type Len Label 1 OSITE Num 8 Stratum identifier 2 RYVAS Num 8 Cluster identifier 3 ID Num 8 Element identifier 4 SEX Num 8 Gender 5 AGE Num 8 Age in years 6 AGE2 Num 8 Age under/over 45 7 PHYS Num 8 Physical health hazards of work 8 CHRON Num 8 Chronic morbidity 9 PSYCH Num 8 Psychic strain - 1st princomp 10 PSYCH2 Num 8 Psychic strain - dichotomy JY Metodifestivaali Risto Lehtonen OHC Survey SAS-data OHCjy OHCjy 7841 henkilöä 10 muuttujaa 5 ositetta 250 otosryvästä Rypäinä toimipaikat JY Metodifestivaali Risto Lehtonen
10 Rypäiden positiivisen sisäkorrelaation vaikutukset analyysin kannalta Vastaavankokoiseen alkiotasoiseen otanta- aineistoon verrattuna ryväsotanta-aineistossa: aineistossa: Tehokas otoskoko pienenee Tunnuslukujen keskivirheet kasvavat Luottamusvälit (virhemarginaalit) suurenevat Testisuureiden tilastollinen merkitsevyys heikkenee JY Metodifestivaali Risto Lehtonen Asetelmakerroin Deff ja sisäkorrelaatio Asetelmakerroin (Design effect, deff) mittaa otanta-asetelman ryvästymisen vaikutusta estimaattorin varianssiin Esimerkiksi osuustunnusluvun (suhteellisen osuuden) estimoitu asetelmakerroin on: v ˆ ˆ clu( p) vclu( p) deff ( pˆ ) = = = 1 + ( n 1) ˆ ρint v ( ˆ) ˆ(1 ˆ srs p p p)/ n missä ˆp on estimoitu osuustunnusluku ˆ ρ int on sisäkorrelaatio (intra-cluster correlation) n on rypäiden keskimääräinen otoskoko v clu on ryväsotanta-asetelman mukainen otosvarianssi srs v on yksinkertaiseen satunnaisotantaan perustuva otosvarianssi (tässä binominen varianssilauseke) JY Metodifestivaali Risto Lehtonen
11 SAS data OHCjy: Deff-estimaatit (Lehtonen&Pahkinen 2004) Table 5.8 Averages of design-effect estimates of proportion estimates of selected groups of binary response variables in the OHC Survey data set (number of variables in parentheses). Study variable Mean deff Physical working conditions (12) 6.5 Psycho-social working conditions (11) 3.3 Psychosomatic symptoms (8) 2.0 Psychic symptoms (9) 1.8 JY Metodifestivaali Risto Lehtonen Asetelmakerroin, sisäkorrelaatio ja tehokas otoskoko Asetelmakerroin ja sisäkorrelaatio ˆ ρ int deff ( p ˆ ) 1 = n 1 Tehokas otoskoko (efficient sample size): n eff n n = = deff ( pˆ ) 1 + ( n 1) ˆ ρint missä n on alkiotason otoskoko n on rypäiden keskimääräinen otoskoko JY Metodifestivaali Risto Lehtonen
12 Tehokas otoskoko ja sisäkorrelaatio SAS data OHCjy: Fysikaaliset työolot Asetelmakerroin deff = 6.5 Sisäkorrelaatio rho = Otoskoko n = 7841 henkilöä Tehokas otoskoko n(eff) = 7841/6.5 = 1206 henkilöä JY Metodifestivaali Risto Lehtonen Tehokas otoskoko ja sisäkorrelaatio SAS data OHCjy: Psyykkiset oireet Asetelmakerroin deff = 1.8 Sisäkorrelaatio rho = Otoskoko n = 7841 henkilöä Tehokas otoskoko n(eff) = 7841/1.8 = 4356 henkilöä JY Metodifestivaali Risto Lehtonen
13 OHC Survey Tilastollinen analyysi Kysymys: Millä vaihtoehtoisilla tavoilla voidaan reagoida tilastollisen analyysin yhteydessä OHCtutkimuksen otanta-asetelman ominaisuuksiin? Ositettu kaksiasteinen ryväsotanta Painotus - painomuuttuja: Tässä painot = 1 Ositus - ositusmuuttuja OSITE Ryvästyminen - ryväsmuuttuja RYVAS JY Metodifestivaali Risto Lehtonen OHC Survey Tilastollinen analyysi Tarkastellaan esimerkinomaisesti kahta vaihtoehtoista lähestymistapaa Asetelmaperusteinen (Design-based) tilastollinen analyysi Binäärinen vaste: Logistinen kiinteiden tekijöiden malli (logit ANCOVA) Malliperusteinen (Model-based) tilastollinen analyysi Binäärinen vaste: Logistinen sekamalli (logit ANCOVA) JY Metodifestivaali Risto Lehtonen
14 Asetelmaperusteinen (design-based) analyysi Perinteinen lähestymistapa mutkikkaiden otantaasetelmien tilanteissa Aineiston tilastollisessa analyysissa luovutaan oletuksesta, että havainnot olisivat toisistaan riippumattomia Luovutaan iid-oletuksesta (independent identically distributed) Sallitaan, että havainnot voivat korreloida keskenään rypäiden sisällä Korreloituneisuuteen reagoidaan asetelmaperusteisilla menetelmillä Asetelmaperusteiset piste-estimaatit ja keskivirheet Asetelmaperusteiset tilastolliset testit JY Metodifestivaali Risto Lehtonen Asetelmaperusteinen (design-based) analyysi Ohjelmistot SAS: SURVEY-proseduurit SURVEYMEANS, SURVEYFREQ, SURVEYREG, SURVEYLOGISTIC SPSS: Complex Samples -moduli Stata: SVY-proseduurit Muut: R-funktioita, LISREL, Mplus JY Metodifestivaali Risto Lehtonen
15 Asetelmaperusteinen (design-based) analyysi Kirjallisuutta Chambers R.L. and Skinner C.J. (Eds.) (2004). Analysis of Survey Data. Chichester: Wiley. Lehtonen R. and Pahkinen E. (2004). Practical Methods for Design and Analysis of Complex Surveys. Second Edition. Chichester: Wiley. Luvut 5, 7-9 JY Metodifestivaali Risto Lehtonen Malliperusteinen (model-based) analyysi Mutkikkaan otanta-asetelman ominaisuuksien i i mallinnus Luovutaan iid-oletuksesta Rypäiden sisäkorreloituneisuuteen reagoidaan mallintamalla Kiinteiden tekijöiden mallit ja GEE-estimointi (Generalized Estimating Equations) SAS GENMOD Sekamallit (Mixed models) / Monitasomallit (Multilevel models) SAS (MIXED, GLIMMIX), MLwiN, SPSS/ MIXED, LISREL, Mplus, R function lme, JY Metodifestivaali Risto Lehtonen
16 Malliperusteinen (model-based) analyysi Kirjallisuutta Demidenko E. (2004). Mixed Models. Theory and Applications. New York: Wiley. Diggle P. J., Liang, K.-Y. & Zeger, S. L. (1994). Analysis of Longitudinal Data. Oxford: Oxford University Press. Goldstein H. (2003). Multilevel Statistical Models. 3rd edition. London: Arnold; New York: John Wiley & Sons. JY Metodifestivaali Risto Lehtonen OHC-survey: Frekvenssiaineisto (Lehtonen&Pahkinen 2004) Logit-ANOVA Table 8.2 Proportion p of persons in the upper psychic strain group, with standard error estimates s.e and design-effect estimates deff of the proportions, and ddomain sample sizes n and dthe number of sample clusters m (the OHC Survey). Domain SEX AGE PHYS p s.e deff n m 1 Males Females All JY Metodifestivaali Risto Lehtonen
17 Asetelmaperusteinen analyysi logitmalleilla SAS-proseduuri SURVEYLOGISTIC Logistinen malli: Yleistettyjen lineaaristen mallien perheen jäsen Binäärinen (0 / 1) tulosmuuttuja Moniluokkainen tulosmuuttuja Otanta-asetelman ominaisuudet voidaan ottaa huomioon Ositus STRATA-lause Ryvästys CLUSTER-lause Painotus WEIGHT-lause JY Metodifestivaali Risto Lehtonen Logit ANCOVA, tilastometodinen kuvaus Lehtonen&Pahkinen (2004) 8.4 LOGISTIC AND LINEAR REGRESSION Design-based and Binomial PML Methods Logistic Regression Example 8.2 JY Metodifestivaali Risto Lehtonen
18 TILASTOLLINEN MALLI Logitmalli (logistinen malli) Tulosmuuttuja y alkiolle y k : y k = 1 jos tutkittava ilmiö tapahtuu y = 0 muulloin k Tilastollinen malli: exp( x kβ) Em( yk) = P{ yk = 1} = 1+ exp( x β) k missä x k = (1, x1 k,, x pk) on selittävien muuttujien arvojen vektori alkiolle k β ( β, β,, β ) on estimoitavien parametrien vektori = 0 1 p JY Metodifestivaali Risto Lehtonen ESIMERKKI Kiinteiden tekijöiden logitmalli y k logit( yk) = log = x kβ = β0 + β1x1 k 1 yk missä β 0 on mallin kiinteä vakiotermi (intercept) β on kulmakerroin (slope) 1 Monitasomalli (sekamalli) y k logit( yk u) = log = β0 + u0d + β1x1 k 1 yk missä u 0d on satunnainen vakiotermi (random intercept) JY Metodifestivaali Risto Lehtonen
19 Logitmallin parametrien asetelmaperusteinen estimointi GWLS-estimointi ei-iteratiivinen menetelmä Painotettu PNS Generalized weighted least squares PML-estimointi yleisimmin käytetty menetelmä Pseudo-uskottavuus Pseudo maximum likelihood Iteratiivinen menetelmä SAS/SURVEYLOGISTIC, GENMOD, ym. GEE-estimointi vaihtoehto PML-menetelmälle Yleistetyt estimointiyhtälöt Generalized estimating equations SAS/GENMOD (malliperusteinen) REML-estimointi Sekamalli Restricted (residual) maximum likelihood SAS/ MIXED, R funktio lme, ym. JY Metodifestivaali Risto Lehtonen Asetelmaperusteinen Waldin testisuure ˆ 2 β 2 j Χ des ( β j ) =, j = 1,, p + 1 v ( ˆ β ) des j 2 joka on asymptoottisesti χ -jakautunut vapausastein df=1 Termi ˆj β on estimoitu logit-regressiokerroin (esim. PML) Termi v ( βˆ ) on asetelmaperusteisesti estimoitu varianssi des j (esim. linearisointimenetelmä, jackknife, bootstrap) ˆ β j Vastaava t-testisuure t des( β j ) = s.e ( ˆ des β j ) on Waldin testisuureen merkkinen neliöjuuri JY Metodifestivaali Risto Lehtonen
20 ESIMERKKI Lehtonen&Pahkinen (2004) Example 8.2 Asetelmaperusteinen logistinen ANCOVA OHC Survey Ositettu ryväsotanta-asetelma H= 5 ositetta m= 250 toimipaikkaa (otosryvästä) n = 7841 otoshenkilöä JY Metodifestivaali Risto Lehtonen Muuttujat Binäärinen tulosmuuttuja: PSYCH2 Psyykkinen rasittuneisuus 0: Lievä (alle mediaanin) 1: Vakava (yli mediaanin) Diskreetti selittäjä Sukupuoli SEX (M/F) Jatkuvat selittäjät Ikä AGE (vuosina) Työn fysikaaliset haitat: PHYS (0/1) Pitkäaikaissairastavuus: CHRON (0/1) JY Metodifestivaali Risto Lehtonen
21 Tilastollinen malli Logit-ANCOVA-malli logit(p) = INTERCEPT + SEX + AGE + PHYS + CHRON + SEX*AGE + SEX*PHYS + SEX*CHRON missä P = Prob(Psych2 = 1 X) Tuntematon osuusparametri Todennäköisyys kuulua vakavamman psyykkisen rasittuneisuuden luokkaan JY Metodifestivaali Risto Lehtonen Mallin sovittaminen asetelmaperusteisesti Mallin parametrivektorin estimointi PML-estimointi Pseudolikelihood SAS/SURVEYLOGISTIC Lopullinen redusoitu malli: logit(p) = INTERCEPT + SEX + AGE + PHYS + CHRON + SEX*AGE JY Metodifestivaali Risto Lehtonen
22 SAS Procedure SURVEYLOGISTIC proc surveylogistic data=ohcjy; title1 "Asetelmaperusteinen: Ryväsotanta-asetelma"; title2 "Sallitaan havaintojen riippuvuus"; strata osite; cluster ryvas; class sex / param=ref; model psych2(event=last)=sex age phys chron sex*age / link=logit rsquare; run; JY Metodifestivaali Risto Lehtonen Lehtonen & Pahkinen (2004) Table 8.8 JY Metodifestivaali Risto Lehtonen
23 Suhteellinen riski Odds Ratio OR Sukupuoli-ikävakioitu suhteellinen riski Odds Ratio, OR (asetelmaperusteinen 95% luottamusväli): OR(PHYS) = 1.32 (1.17, 1.48) OR(CHRON) = 1.76 (1.57, 1.97) JY Metodifestivaali Risto Lehtonen JY Metodifestivaali Risto Lehtonen
24 SAS-demot klo 14:30-16 SAS-koodi: SAS_Demo Asetelmaperusteinen analyysi SAS Procedure SURVEYLOGISTIC Malliperusteinen analyysi SAS Procedure GENMOD SAS Procedure GLIMMIX JY Metodifestivaali Risto Lehtonen VLISS-Virtual Laboratory in Survey Sampling Risto Lehtonen and Erkki Pahkinen (2004). Practical Methods for Design and Analysis of Complex Surveys. Chichester: Wiley. TRAINING KEY 288: Logistic ANCOVA In Training Key 288, logistic analysis of covariance (ANCOVA) is demonstrated for a binary response variable and the results of Example 8.2 are reproduced. Pseudolikelihood (PML) estimation is used for the OHC Survey data set, accounting for the sampling complexities. An option is provided for a detailed examination of the role of interaction effects in a logistic ANCOVA model. JY Metodifestivaali Risto Lehtonen
25 Tilastolliset ohjelmistot: Korreloituneiden aineistojen analyysi Hierarkkisesti rakentunut aineisto Ryväsrakenne Ositerakenne Asetelmaperusteinen analyysi Painomuuttuja Ositusmuuttuja Ryväsmuuttuja Malliperusteinen analyysi Painomuuttuja Ryväsmuuttuja JY Metodifestivaali Risto Lehtonen Tilastollinen ohjelmisto: SAS Asetelmaperusteinen analyysi SURVEY-proseduurit (SAS versio 9) SURVEYMEANS Keskiarvot SURVEYFREQ Ristiintaulukointi Asetelmaperusteiset testit SURVEYREG Lineaarinen regressioanalyysi, ANOVA, ANCOVA SURVEYLOGISTIC Logistiset mallit JY Metodifestivaali Risto Lehtonen
26 Tilastollinen ohjelmisto: SAS Malliperusteinen analyysi Monitasomallien (sekamallien) sovittaminen MIXED - Esimerkki Lineaariset sekamallit GLIMMIX - Esimerkki Yleistetyt lineaariset sekamallit NLMIXED Epälineaariset sekamallit JY Metodifestivaali Risto Lehtonen Tilastollinen ohjelmisto: SPSS Complex samples (SPSS versio 16) Hierarkkinen data Ositettu ryväsotanta Asetelmaperusteinen analyysi Asetelmapainot tai analyysipainot Ositusmuuttuja Ryväsmuuttuja Modulit CSPLAN ja CSSELECT Otoksen poiminta CSDESCRIPTIVES Kuvailevat tunnusluvut CSTABULATE Ristiintaulukointi ja testit CSGLM, CSLOGISTIC Lineaariset ja logistiset mallit 26
27 Tilastollinen ohjelmisto: STATA STATA (versio 10) Hierarkkinen data Ositettu ryväsotanta Asetelmaperusteinen analyysi Analyysipainot Ositusmuuttuja Ryväsmuuttuja SVY-optiot (SurVeY data) Kuvailevat tunnusluvut ja testisuureet Yleistetyt lineaariset mallit Biometrian menetelmiä ja malleja Ekonometrian menetelmiä ja malleja Tilastollinen ohjelmisto: LISREL LISREL 8.7 Win Hierarkkinen data Ositettu ryväsotanta Asetelmaperusteinen analyysi Analyysipainot Ositusmuuttuja tt Ryväsmuuttuja Menetelmät, esimerkiksi: Yleistetyt lineaariset mallit Lineaariset sekamallit 27
28 Tilastollinen ohjelmisto: Mplus Mplus Hierarkkinen data Ositettu ryväsotanta Asetelmaperusteinen analyysi Analyysipainot Ositusmuuttuja tt Ryväsmuuttuja Menetelmät, esimerkiksi: Yleistetyt lineaariset mallit Yleistetyt lineaariset sekamallit 28
Otanta-aineistojen analyysi (78136, 78405) Kevät 2010 TEEMA 3: Frekvenssiaineistojen asetelmaperusteinen analyysi: Perusteita
Otanta-aineistojen analyysi (78136, 78405) Kevät 2010 TEEMA 3: Frekvenssiaineistojen asetelmaperusteinen analyysi: Perusteita risto.lehtonen@helsinki.fi OHC Survey Tilastollinen analyysi Kysymys: Millä
LisätiedotOtanta-aineistojen analyysi (78136, 78405) Kevät 2010 TEEMA 4: Asetelmaperusteinen monimuuttuja-analyysi
Otanta-aineistojen analyysi (78136, 78405) Kevät 2010 TEEMA 4: Asetelmaperusteinen monimuuttuja-analyysi Risto Lehtonen risto.lehtonen@helsini.fi Analyysimenetelmiä ja työaluja Lineaariset mallit Regressioanalyysi
Lisätiedot(78143) Syksy 2009 TEEMAT 3 & 4. Risto Lehtonen Teema 3 ERITYISKYSYMYKSIÄ. Risto Lehtonen 2
Otantamenetelmät (78143) Syksy 2009 TEEMAT 3 & 4 Risto Lehtonen risto.lehtonen@helsinki.fi Teema 3 ERITYISKYSYMYKSIÄ Risto Lehtonen 2 1 Otannan erityiskysymyksiä Ryväsotanta Survey sampling reference guidelines
LisätiedotOtanta-aineistojen analyysi
Otanta-aineistojen analyysi (78136, 78405) Kevät 2010 TEEMA 1 Risto Lehtonen risto.lehtonen@helsinki.fi Otanta-aineistojen analyysi Laajuus 6/8 op. Tyyppi 78136 Otanta-aineistojen analyysi (aineopintojen
LisätiedotOtanta-aineistojen analyysi Kevät 2010 TEEMA 5: Tilastollinen mallinnus II Mallit, analyysimenetelmiä ja ohjelmia, PISA-esimerkki
Otanta-aineistojen analyysi Kevät 2010 TEEMA 5: Tilastollinen mallinnus II Mallit, analyysimenetelmiä ja ohjelmia, PISA-esimerkki risto.lehtonen@helsinki.fi Korreloituneiden havaintojen analyysi Lineaariset
LisätiedotOtanta-aineistojen analyysi
Helsingin yliopisto Otanta-aineistojen analyysi Kevät 2010 Periodi III Risto Lehtonen Teema 2 Estimaattoreiden varianssien estimointi Survey-analyysin lähestymistavat Kuvaileva survey Descriptive survey
LisätiedotTilastollisten menetelmien käyttö Kelan tutkimustoiminnassa
Tilastollisten menetelmien käyttö Kelan tutkimustoiminnassa Risto Lehtonen Helsingin yliopisto Kela 1 Tilastokeskuksen SAS-seminaari 16.11.2009 Aiheita Kelan tutkimustoiminta SAS-sovellukset vaativien
LisätiedotOtanta-aineistojen analyysi
Helsingin yliopisto Otanta-aineistojen analyysi Kevät 2010 Periodi III Risto Lehtonen Teema 4 Asetelmaperusteinen monimuuttujaanalyysi Logistinen ANOVA ja GWLS-estimointi Binäärinen tulosmuuttuja Diskreetit
LisätiedotMonitasomallit koulututkimuksessa
Metodifestivaali 9.5.009 Monitasomallit koulututkimuksessa Mitä ihmettä? Antero Malin Koulutuksen tutkimuslaitos Jyväskylän yliopisto 009 1 Tilastollisten analyysien lähtökohta: Perusjoukolla on luonnollinen
LisätiedotJY / METODIFESTIVAALI 2013 PRE-KURSSI: KYSELYTUTKIMUS DEMOT
JY / METODIFESTIVAALI 2013 PRE-KURSSI: KYSELYTUTKIMUS DEMOT SPSS-ohjelmiston Complex Samples- toiminto otoksen poiminnassa ja estimaattien laskennassa Mauno Keto, lehtori Mikkelin AMK / Liiketalouden laitos
LisätiedotATH-aineiston tilastolliset analyysit SPSS/PASW SPSS analyysit / Risto Sippola 1
ATH-aineiston tilastolliset analyysit SPSS/PASW 16.2.2011 SPSS analyysit / Risto Sippola 1 Aineiston avaaminen Aineisto on saatu SPSS-muotoon ja tallennettu koneelle sijaintiin, josta sitä voidaan käyttää
LisätiedotOtanta-aineistojen analyysi
Helsingin yliopisto Otanta-aineistojen analyysi Kevät 2010 Periodi III Risto Lehtonen Teema 3 Frekvenssiaineistojen asetelmaperusteinen analyysi: Perusteita Johdattava esimerkki - Yksinkertainen yhteensopivuustesti
LisätiedotRegressioanalyysi. Vilkkumaa / Kuusinen 1
Regressioanalyysi Vilkkumaa / Kuusinen 1 Regressioanalyysin idea ja tavoitteet Regressioanalyysin idea: Halutaan selittää selitettävän muuttujan havaittujen arvojen vaihtelua selittävien muuttujien havaittujen
LisätiedotOtantamenetelmät. Syksy
Otantamenetelmät (78143) Sysy 2009 TEEMA 2 risto.lehtonen@helsini.fi Teema 2 LISÄTIEDON KÄYTTÖ ESTIMOINTIASETELMASSA: MALLIAVUSTEINEN ESTIMOINTI 2 Lisätiedon äyttö estimointiasetelmassa i t Malliavusteiset
LisätiedotHealth 2000/2011 Surveys. Statistical Analysis using SAS and SAS-Callable SUDAAN Packages 17.6.2013. Esa Virtala. etunimi.sukunimi@thl.
Health 2000/2011 Surveys Statistical Analysis using SAS and SAS-Callable SUDAAN Packages 17.6.2013 Esa Virtala etunimi.sukunimi@thl.fi Terveyden ja hyvinvoinnin laitos (THL) PL 30 00271 Helsinki Puhelin:
LisätiedotTommi Härkänen, Teppo Juntunen, Eero Lilja Analyysiohjeita Maahanmuuttajien terveys- ja hyvinvointitutkimusaineiston käsittelemiseksi.
Tommi Härkänen, Teppo Juntunen, Eero Lilja Analyysiohjeita Maahanmuuttajien terveys- ja hyvinvointitutkimusaineiston käsittelemiseksi Taustaa Otoksen ositus kunnittain ja maahanmuuttajaryhmittäin Katso
Lisätiedottilastotieteen kertaus
tilastotieteen kertaus Keskiviikon 24.1. harjoitukset pidetään poikkeuksellisesti klo 14-16 luokassa Y228. Heliövaara 1 Mitä tilastotiede on? Tilastotiede kehittää ja soveltaa menetelmiä, joiden avulla
LisätiedotPerusestimointi 5 Analyysiä survey-datalla Tee Suomen datalla jokin oma kokeilu käyttäen tätä mallia Esimerkki PISA 2006:sta SAS:lla
Perusestimointi 5 Analyysiä survey-datalla Tee Suomen datalla jokin oma kokeilu käyttäen tätä mallia Esimerkki PISA 2006:sta SAS:lla proc surveymeans data=pisa.impuoecd; where cnt='fin' or cnt='deu' or
LisätiedotPienalue-estimointi (78189) Kevät 2011 Risto Lehtonen
Helsingin yliopisto Sosiaalitieteien laitos 1 Pienalue-estimointi (78189) Kevät 2011 Risto Lehtonen OSA 4 Laajennettu GREG-estimaattoreien perhe Avustavat mallit Yleistetty lineaarinen malli Lineaarinen
LisätiedotTilastotieteen aihehakemisto
Tilastotieteen aihehakemisto hakusana ARIMA ARMA autokorrelaatio autokovarianssi autoregressiivinen malli Bayes-verkot, alkeet TILS350 Bayes-tilastotiede 2 Bayes-verkot, kausaalitulkinta bootstrap, alkeet
LisätiedotOtantamenetelmät (78143) Syksy 2008 OSA 2: Malliavusteinen estimointi. Risto Lehtonen
Otantamenetelmät (78143) Sysy 2008 OSA 2: Malliavusteinen estimointi Risto Lehtonen risto.lehtonen@helsini.fi Lisätiedon äyttö estimointiasetelmassa Tavoitteena estimoinnin tehostaminen poimitulle otoselle
LisätiedotJakaumien merkitys biologisissa havaintoaineistoissa: Löytyykö ratkaisu Yleistetyistä Lineaarisista (Seka)Malleista?
1 Hydrobiologian tutkijaseminaari 20.3.2000 Jakaumien merkitys biologisissa havaintoaineistoissa: Löytyykö ratkaisu Yleistetyistä Lineaarisista (Seka)Malleista? Jari Hänninen Turun yliopisto Saaristomeren
LisätiedotHarha mallin arvioinnissa
Esitelmä 12 Antti Toppila sivu 1/18 Optimointiopin seminaari Syksy 2010 Harha mallin arvioinnissa Antti Toppila 13.10.2010 Esitelmä 12 Antti Toppila sivu 2/18 Optimointiopin seminaari Syksy 2010 Sisältö
LisätiedotTilastotieteen kertaus. Kuusinen/Heliövaara 1
Tilastotieteen kertaus Kuusinen/Heliövaara 1 Mitä tilastotiede on? Tilastotiede kehittää ja soveltaa menetelmiä, joiden avulla reaalimaailman ilmiöistä voidaan tehdä johtopäätöksiä tilanteissa, joissa
LisätiedotRegressioanalyysi. Kuusinen/Heliövaara 1
Regressioanalyysi Kuusinen/Heliövaara 1 Regressioanalyysin idea ja tavoitteet Regressioanalyysin idea: Oletetaan, että haluamme selittää jonkin selitettävän muuttujan havaittujen arvojen vaihtelun joidenkin
LisätiedotEpävarmuuden hallinta bootstrap-menetelmillä
1/17 Epävarmuuden hallinta bootstrap-menetelmillä Esimerkkinä taloudellinen arviointi Jaakko Nevalainen Tampereen yliopisto Metodifestivaalit 2015 2/17 Sisältö 1 Johdanto 2 Tavanomainen bootstrap Bootstrap-menettelyn
LisätiedotTilastollinen aineisto Luottamusväli
Tilastollinen aineisto Luottamusväli Keijo Ruotsalainen Oulun yliopisto, Teknillinen tiedekunta Matematiikan jaos Tilastollinen aineisto p.1/20 Johdanto Kokeellisessa tutkimuksessa tutkittavien suureiden
LisätiedotATH-koulutus: Stata 11 THL ATH-koulutus / Tommi Härkänen 1
ATH-koulutus: Stata 11 THL 16.2.2011 16. 2. 2011 ATH-koulutus / Tommi Härkänen 1 Sisältö Otanta-asetelman kuvaaminen Stata 11:llä Perustunnusluvut Regressioanalyysit Mallivakiointi 16. 2. 2011 ATH-koulutus
LisätiedotParametrin estimointi ja bootstrap-otanta
Parametrin estimointi ja bootstrap-otanta Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo Tutkimustiedonhallinnan peruskurssi Parametrin estimointi ja bootstrap-otanta 1/27 Kevät 2003 Käytännön asioista
LisätiedotTilastotieteen kertaus. Vilkkumaa / Kuusinen 1
Tilastotieteen kertaus Vilkkumaa / Kuusinen 1 Motivointi Reaalimaailman ilmiöihin liittyy tyypillisesti satunnaisuutta ja epävarmuutta Ilmiöihin liittyvien havaintojen ajatellaan usein olevan peräisin
LisätiedotLumipallo regressioanalyysista. Logistinen regressioanalyysi. Soveltuvan menetelmän valinta. Regressioanalyysi. Logistinen regressioanalyysi I
Lumipallo regressioanalyysista jokainen kirjoittaa lapulle yhden lauseen regressioanalyysista ja antaa sen seuraavalle Logistinen regressioanalyysi Y250. Kvantitatiiviset menetelmät (6 op) Hanna Wass tutkijatohtori
LisätiedotYleistetyistä lineaarisista malleista
Yleistetyistä lineaarisista malleista Tilastotiede käytännön tutkimuksessa -kurssi, kesä 2001 Reijo Sund Klassinen lineaarinen malli y = Xb + e eli E(Y) = m, jossa m = Xb Satunnaiskomponentti: Y:n komponentit
LisätiedotLiite artikkeliin Intohimo tasa-arvoon
Liite artikkeliin Intohimo tasa-arvoon Menetelmäkuvaus Artikkelissa käytetty regressiomalli on ns. binäärinen logistinen monitasoregressiomalli. Monitasoanalyysien ideana on se, että yksilöiden vastauksiin
Lisätiedot805306A Johdatus monimuuttujamenetelmiin, 5 op
monimuuttujamenetelmiin, 5 op syksy 2018 Matemaattisten tieteiden laitos Logistinen regressioanalyysi Vastemuuttuja Y on luokiteltu muuttuja Pyritään mallittamaan havaintoyksikön todennäköisyyttä kuulua
LisätiedotSAS/IML käyttö ekonometristen mallien tilastollisessa päättelyssä. Antti Suoperä 16.11.2009
SAS/IML käyttö ekonometristen mallien tilastollisessa päättelyssä Antti Suoperä 16.11.2009 SAS/IML käyttö ekonometristen mallien tilastollisessa päättelyssä: Matriisi ja vektori laskennan ohjelmisto edellyttää
LisätiedotPienalue-estimointi (78189) Kevät 2011. Risto Lehtonen Helsingin yliopisto
Pienalue-estimointi (78189) Kevät 2011 Risto Lehtonen Helsingin yliopisto Pienalue-estimointi Kurssin kotisivu http://wiki.helsinki.fi/pages/viewpage.action?pagei=62430039 2 Hyöyllisiä taustatietoja Otantamenetelmät
LisätiedotEstimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?
TKK (c) Ilkka Mellin (2004) 1 Johdatus tilastotieteeseen TKK (c) Ilkka Mellin (2004) 2 Mitä opimme? 1/4 Tilastollisen tutkimuksen tavoitteena on tehdä johtopäätöksiä prosesseista, jotka generoivat reaalimaailman
LisätiedotJohdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1
Johdatus tilastotieteeseen Estimointi TKK (c) Ilkka Mellin (2005) 1 Estimointi Todennäköisyysjakaumien parametrit ja niiden estimointi Hyvän estimaattorin ominaisuudet TKK (c) Ilkka Mellin (2005) 2 Estimointi:
LisätiedotABHELSINKI UNIVERSITY OF TECHNOLOGY
Johdatus regressioanalyysiin Regressioanalyysin idea Oletetaan, että haluamme selittää jonkin selitettävän muuttujan havaittujen arvojen vaihtelun selittävien muuttujien havaittujen arvojen vaihtelun avulla.
LisätiedotTeema 8: Parametrien estimointi ja luottamusvälit
Teema 8: Parametrien estimointi ja luottamusvälit Todennäköisyyslaskennan perusteet (Teemat 6 ja 7) antavat hyvän pohjan siirtyä kurssin viimeiseen laajempaan kokonaisuuteen, nimittäin tilastolliseen päättelyyn.
LisätiedotTA7, Ekonometrian johdantokurssi HARJOITUS 4 1 RATKAISUEHDOTUKSET
TA7, Ekonometrian johdantokurssi HARJOITUS 4 1 RATKAISUEHDOTUKSET 16..015 1. a Poliisivoimien suuruuden lisäksi piirikuntien rikostilastoihin vaikuttaa monet muutkin tekijät. Esimerkiksi asukkaiden keskimääräinen
LisätiedotEstimaattoreiden asetelmaperusteinen
Otanta-aineistojen aineistojen analyysi (78136, 78405) Kevät 2010 TEEMA 2: Estimaattoreiden varianssin estimointi Risto Lehtonen risto.lehtonen@helsinki.fi Estimaattoreiden asetelmaperusteinen varianssien
LisätiedotSovellettu todennäköisyyslaskenta B
Sovellettu todennäköisyyslaskenta B Antti Rasila 22. marraskuuta 2007 Antti Rasila () TodB 22. marraskuuta 2007 1 / 17 1 Epäparametrisia testejä (jatkoa) χ 2 -riippumattomuustesti 2 Johdatus regressioanalyysiin
LisätiedotMat Tilastollisen analyysin perusteet, kevät 2007
Mat-.104 Tilastollisen analyysin perusteet, kevät 007 8. luento: Usean selittäjän lineaarinen regressiomalli Kai Virtanen 1 Usean selittäjän lineaarinen regressiomalli Selitettävän muuttujan havaittujen
LisätiedotA250A0050 Ekonometrian perusteet Tentti
A250A0050 Ekonometrian perusteet Tentti 28.9.2016 Tentissä ei saa käyttää laskinta. Tentistä saa max 80 pistettä. Hyväksytysti suoritetusta harjoitustyöstä saa max 20 pistettä. Huom. Merkitse vastauspaperin
LisätiedotSovellettu todennäköisyyslaskenta B
Sovellettu todennäköisyyslaskenta B Antti Rasila 30. lokakuuta 2007 Antti Rasila () TodB 30. lokakuuta 2007 1 / 23 1 Otos ja otosjakaumat (jatkoa) Frekvenssi ja suhteellinen frekvenssi Frekvenssien odotusarvo
LisätiedotHarjoitus 9: Excel - Tilastollinen analyysi
Harjoitus 9: Excel - Tilastollinen analyysi Mat-2.2107 Sovelletun matematiikan tietokonetyöt Syksy 2006 Mat-2.2107 Sovelletun matematiikan tietokonetyöt 1 Harjoituksen aiheita Tutustuminen regressioanalyysiin
LisätiedotTestit laatueroasteikollisille muuttujille
Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Testit laatueroasteikollisille muuttujille TKK (c) Ilkka Mellin (2007) 1 Testit laatueroasteikollisille muuttujille >> Laatueroasteikollisten
Lisätiedotpitkittäisaineistoissa
Puuttuvan tiedon ongelma p. 1/18 Puuttuvan tiedon ongelma pitkittäisaineistoissa Tapio Nummi tan@uta.fi Matematiikan, tilastotieteen ja filosofian laitos Tampereen yliopisto mtl.uta.fi/tilasto/sekamallit/puupitkit.pdf
Lisätiedot54. Tehdään yhden selittäjän lineaarinen regressioanalyysi, kun selittäjänä on määrällinen muuttuja (ja selitettävä myös):
Tilastollinen tietojenkäsittely / SPSS Harjoitus 5 Tarkastellaan ensin aineistoa KUNNAT. Kyseessähän on siis kokonaistutkimusaineisto, joten tilastollisia testejä ja niiden merkitsevyystarkasteluja ei
LisätiedotEsim Brand lkm keskiarvo keskihajonta A ,28 5,977 B ,06 3,866 C ,95 4,501
Esim. 2.1.1. Brand lkm keskiarvo keskihajonta A 10 251,28 5,977 B 10 261,06 3,866 C 10 269,95 4,501 y = 260, 76, n = 30 SS 1 = (n 1 1)s 2 1 = (10 1)5, 977 2 321, 52 SS 2 = (n 2 1)s 2 2 = (10 1)3, 8662
LisätiedotLoad
Tampereen yliopisto Tilastollinen mallintaminen Mikko Alivuotila ja Anne Puustelli Lentokoneiden rakennuksessa käytettävien metallinkiinnittimien puristuskestävyys Matematiikan, tilastotieteen ja filosofian
LisätiedotKLIINISTEN TUTKIMUSTEN SUUNNITTELU JA KOEASETELMAT. Vesa Kiviniemi (FL) Itä-Suomen yliopisto
KLIINISTEN TUTKIMUSTEN SUUNNITTELU JA KOEASETELMAT Vesa Kiviniemi (FL) Itä-Suomen yliopisto 13.4.2010 SISÄLTÖ 1 Kokeellisen tutkimuksen tutkimustyypit 2 Kohdepopulaatio ja potilaiden valinta 3 Vertailuryhmän
LisätiedotPienalue-estimointi (78189) Kevät 2011 Risto Lehtonen
Helsingin yliopisto Sosiaalitieteien laitos 1 Pienalue-estimointi (78189) Kevät 2011 Risto Lehtonen OSA 3 GREG-estimaattori Yleinen tilanne (unequal probability sampling) Komposiittiestimaattorit (Composite
Lisätiedot[MTTTA] TILASTOMENETELMIEN PERUSTEET, KEVÄT 209 https://coursepages.uta.fi/mttta/kevat-209/ HARJOITUS 5 viikko 8 RYHMÄT: ke 2.5 3.45 ls. C6 Leppälä to 08.30 0.00 ls. C6 Korhonen to 2.5 3.45 ls. C6 Korhonen
LisätiedotTilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta
Tilastollisen analyysin perusteet Luento 1: ja hajonta Sisältö Havaittujen arvojen jakauma Havaittujen arvojen jakaumaa voidaan kuvailla ja esitellä tiivistämällä havaintoarvot sopivaan muotoon. Jakauman
LisätiedotTUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas
TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012 Timo Törmäkangas Itse arvioidun terveydentilan ja sukupuolen välinen riippuvuustarkastelu. Jyväskyläläiset 75-vuotiaat miehet ja naiset vuonna 1989.
LisätiedotATH-koulutus: R ja survey-kirjasto THL 16.2.2011. 16. 2. 2011 ATH-koulutus / Tommi Härkänen 1
ATH-koulutus: R ja survey-kirjasto THL 16.2.2011 16. 2. 2011 ATH-koulutus / Tommi Härkänen 1 Sisältö Otanta-asetelman kuvaaminen R:llä ja survey-kirjastolla Perustunnusluvut Regressioanalyysit 16. 2. 2011
Lisätiedot805306A Johdatus monimuuttujamenetelmiin, 5 op
monimuuttujamenetelmiin, 5 op syksy 2018 Matemaattisten tieteiden laitos Lineaarinen erotteluanalyysi (LDA, Linear discriminant analysis) Erotteluanalyysin avulla pyritään muodostamaan selittävistä muuttujista
LisätiedotMat Tilastollisen analyysin perusteet, kevät 2007
Mat-.14 Tilastollisen analyysin perusteet, kevät 7 7. luento: Tarina yhden selittään lineaarisesta regressiomallista atkuu Kai Virtanen 1 Luennolla 6 opittua Kuvataan havainnot (y, x ) yhden selittään
LisätiedotTilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin
Tilastollisen analyysin perusteet Luento 10: Sisältö Varianssianalyysi Varianssianalyysi on kahden riippumattoman otoksen t testin yleistys. Varianssianalyysissä perusjoukko koostuu kahdesta tai useammasta
LisätiedotJohdatus regressioanalyysiin. Heliövaara 1
Johdatus regressioanalyysiin Heliövaara 1 Regressioanalyysin idea Oletetaan, että haluamme selittää jonkin selitettävän muuttujan havaittujen arvojen vaihtelun selittävien muuttujien havaittujen arvojen
LisätiedotFoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 9. luento. Pertti Palo
FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa 9. luento Pertti Palo 22.11.2012 Käytännön asioita Eihän kukaan paikallaolijoista tee 3 op kurssia? 2. seminaarin ilmoittautuminen. 2. harjoitustyön
LisätiedotTilastollisen analyysin perusteet Luento 9: Moniulotteinen lineaarinen. regressio
Tilastollisen analyysin perusteet Luento 9: lineaarinen lineaarinen Sisältö lineaarinen lineaarinen lineaarinen Lineaarinen Oletetaan, että meillä on n kappaletta (x 1, y 1 ), (x 2, y 2 )..., (x n, y n
LisätiedotATH-koulutus THL 16.2.2011. 16. 2. 2011 ATH-koulutus / Tommi Härkänen 1
ATH-koulutus THL 16.2.2011 16. 2. 2011 ATH-koulutus / Tommi Härkänen 1 Sisältö Otanta-asetelma Ositus ja 75 vuotta täyttäneiden ylipoiminta Painokertoimet Tulosten esittäminen: mallivakiointi Esimerkit
LisätiedotIdentifiointiprosessi
Alustavia kokeita Identifiointiprosessi Koesuunnittelu, identifiointikoe Mittaustulosten / datan esikäsittely Ei-parametriset menetelmät: - Transientti-, korrelaatio-, taajuus-, Fourier- ja spektraalianalyysi
LisätiedotPienet ännät tutkimuksessa Tilastollisen analyysin työpaja. Jari Westerholm Niilo Mäki instituutti Jyväskylän yliopisto
Pienet ännät tutkimuksessa Tilastollisen analyysin työpaja Jari Westerholm Niilo Mäki instituutti Jyväskylän yliopisto Luennon sisältö Pienten otoskokojen haasteista Pieni otoskoko Suositeltuja metodeja
LisätiedotMS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 4A Parametrien estimointi Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2016, periodi
LisätiedotVARIANSSIANALYYSI ANALYSIS OF VARIANCE
VARIANSSIANALYYSI ANALYSIS OF VARIANCE 1 Suomalaisten aikuisten pituusjakauma:.8.7.6.5.4.3.2.1 14 15 16 17 18 19 2 21 Jakauma ei ole normaali, sen olettaminen sellaiseksi johtaa virheellisiin päätelmiin.
Lisätiedot2. Uskottavuus ja informaatio
2. Uskottavuus ja informaatio Aluksi käsittelemme uskottavuus- ja log-uskottavuusfunktioita Seuraavaksi esittelemme suurimman uskottavuuden estimointimenetelmän Ensi viikolla perehdymme aiheeseen lisääkö
LisätiedotIlkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi
Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi TKK (c) Ilkka Mellin (2006) 1 Estimointi >> Todennäköisyysjakaumien parametrit ja niiden estimointi Hyvän estimaattorin
LisätiedotOsa 2: Otokset, otosjakaumat ja estimointi
Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi TKK (c) Ilkka Mellin (2007) 1 Estimointi >> Todennäköisyysjakaumien parametrit ja niiden estimointi Hyvän estimaattorin
LisätiedotBOOTSTRAPPING? Jukka Nyblom Jyväskylän yliopisto. Metodifestivaali
BOOTSTRAPPING? Jukka Nyblom Jyväskylän yliopisto Metodifestivaali 28.5.2009 1 1 Mitä ihmettä on bootstrap? Webster: 1. a loop of leather or cloth sewn at the top rear, or sometimes on each side of a boot
LisätiedotVäliestimointi (jatkoa) Heliövaara 1
Väliestimointi (jatkoa) Heliövaara 1 Bernoulli-jakauman odotusarvon luottamusväli 1/2 Olkoon havainnot X 1,..., X n yksinkertainen satunnaisotos Bernoulli-jakaumasta parametrilla p. Eli X Bernoulli(p).
LisätiedotMitä tarvitsee tietää biostatistiikasta ja miksi? Matti Uhari Lastentautien klinikka Oulun yliopisto
Mitä tarvitsee tietää biostatistiikasta ja miksi? Matti Uhari Lastentautien klinikka Oulun yliopisto Tutkimusaineistomme otantoja Hyödyt Ei tarvitse tutkia kaikkia Oikein tehty otanta mahdollistaa yleistämisen
Lisätiedot031021P Tilastomatematiikka (5 op) kertausta 2. vk:een
031021P Tilastomatematiikka (5 op) kertausta 2. vk:een Jukka Kemppainen Mathematics Division 2. välikokeeseen Toinen välikoe on la 5.4.2014 klo. 9.00-12.00 saleissa L1,L3 Koealue: luentojen luvut 7-11
LisätiedotEstimointi. Vilkkumaa / Kuusinen 1
Estimointi Vilkkumaa / Kuusinen 1 Motivointi Tilastollisessa tutkimuksessa oletetaan jonkin jakauman generoineen tutkimuksen kohteena olevaa ilmiötä koskevat havainnot Tämän mallina käytettävän todennäköisyysjakauman
LisätiedotSovellettu todennäköisyyslaskenta B
Sovellettu todennäköisyyslaskenta B Antti Rasila 18. lokakuuta 2007 Antti Rasila () TodB 18. lokakuuta 2007 1 / 19 1 Tilastollinen aineisto 2 Tilastollinen malli Yksinkertainen satunnaisotos 3 Otostunnusluvut
LisätiedotHAVAITUT JA ODOTETUT FREKVENSSIT
HAVAITUT JA ODOTETUT FREKVENSSIT F: E: Usein Harvoin Ei tupakoi Yhteensä (1) (2) (3) Mies (1) 59 28 4 91 Nainen (2) 5 14 174 193 Yhteensä 64 42 178 284 Usein Harvoin Ei tupakoi Yhteensä (1) (2) (3) Mies
LisätiedotPerhevapaiden palkkavaikutukset
Perhevapaiden palkkavaikutukset Perhe ja ura tasa-arvon haasteena seminaari, Helsinki 20.11.2007 Jenni Kellokumpu Esityksen runko 1. Tutkimuksen tavoite 2. Teoria 3. Aineisto, tutkimusasetelma ja otos
LisätiedotOHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi. Luento 3
OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi Luento 3 Tutkimussuunnitelman rakenne-ehdotus Otsikko 1. Motivaatio/tausta 2. Tutkimusaihe/ -tavoitteet ja kysymykset
LisätiedotJohdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1
Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille TKK (c) Ilkka Mellin (2004) 1 Testit laatueroasteikollisille muuttujille Laatueroasteikollisten muuttujien testit Testi suhteelliselle
LisätiedotErityiskysymyksiä yleisen lineaarisen mallin soveltamisessa
Ilkka Mellin Tilastolliset menetelmät Osa 4: Lineaarinen regressioanalyysi Erityiskysymyksiä yleisen lineaarisen mallin soveltamisessa TKK (c) Ilkka Mellin (2007) 1 Erityiskysymyksiä yleisen lineaarisen
LisätiedotMS-C2128 Ennustaminen ja Aikasarja-analyysi, 5 op Esittely
MS-C2128 Ennustaminen ja Aikasarja-analyysi, 5 op Esittely Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2017 Aikataulu ja suoritustapa (Katso MyCourses) Luennot
LisätiedotTUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas
TUTKIMUSAINEISTON ANALYYSI LTKY012 Timo Törmäkangas JAKAUMAN MUOTO Vinous, skew (g 1, γ 1 ) Kertoo jakauman symmetrisyydestä Vertailuarvona on nolla, joka vastaa symmetristä jakaumaa (mm. normaalijakauma)
LisätiedotMS-C2128 Ennustaminen ja Aikasarja-analyysi, 5 op Esittely
MS-C2128 Ennustaminen ja Aikasarja-analyysi, 5 op Esittely Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2015 Aikataulu ja suoritustapa (Katso MyCourses) Luennot
LisätiedotTutkimustiedonhallinnan peruskurssi
Tutkimustiedonhallinnan peruskurssi Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo hannu.toivonen, marko.salmenkivi, inkeri.verkamo@cs.helsinki.fi Helsingin yliopisto Hannu Toivonen, Marko Salmenkivi,
LisätiedotOtoskoon arviointi. Tero Vahlberg
Otoskoon arviointi Tero Vahlberg Otoskoon arviointi Otoskoon arviointi (sample size calculation) ja tutkimuksen voima-analyysi (power analysis) ovat tilastollisen tutkimuksen suunnittelussa keskeisiä kysymyksiä
LisätiedotJohdatus tilastotieteeseen Väliestimointi. TKK (c) Ilkka Mellin (2005) 1
Johdatus tilastotieteeseen Väliestimointi TKK (c) Ilkka Mellin (2005) 1 Väliestimointi Todennäköisyysjakaumien parametrien estimointi Luottamusväli Normaalijakauman odotusarvon luottamusväli Normaalijakauman
LisätiedotHarjoitukset 2 : Monimuuttujaregressio (Palautus )
31C99904, Capstone: Ekonometria ja data-analyysi TA : markku.siikanen(a)aalto.fi & tuuli.vanhapelto(a)aalto.fi Harjoitukset 2 : Monimuuttujaregressio (Palautus 24.1.2017) Tämän harjoituskerran tarkoitus
LisätiedotIdentifiointiprosessi
Alustavia kokeita Identifiointiprosessi Koesuunnittelu, identifiointikoe Mittaustulosten / datan esikäsittely Ei-parametriset menetelmät: - Transientti-, korrelaatio-, taajuus-, Fourier- ja spektraalianalyysi
LisätiedotTUTKIMUSOPAS. SPSS-opas
TUTKIMUSOPAS SPSS-opas Johdanto Tässä oppaassa esitetään SPSS-tilasto-ohjelman alkeita, kuten Excel-tiedoston avaaminen, tunnuslukujen laskeminen ja uusien muuttujien muodostaminen. Lisäksi esitetään esimerkkien
LisätiedotPerusnäkymä yksisuuntaiseen ANOVAaan
Metsämuuronen 2006. TTP Tutkimuksen tekemisen perusteet ihmistieteissä Taulukko.51.1 Analyysiin mukaan tulevat muuttujat Mja selite Merkitys mallissa F1 Ensimmäinen faktoripistemuuttuja Selitettävä muuttuja
Lisätiedot1. PÄÄTTELY YHDEN SELITTÄJÄN LINEAARISESTA REGRESSIOMALLISTA
Mat-2.104 Tilastollisen analyysin perusteet / Ratkaisut Aiheet: Avainsanat Päättely yhden selittäjän lineaarisesta regressiomallista Ennustaminen, Ennuste, Ennusteen luottamusväli, Estimaatti, Estimaattori,
Lisätiedot1. Tilastollinen malli??
1. Tilastollinen malli?? https://fi.wikipedia.org/wiki/tilastollinen_malli https://en.wikipedia.org/wiki/statistical_model http://projecteuclid.org/euclid.aos/1035844977 Tilastollinen malli?? Numeerinen
LisätiedotLogistinen regressio, separoivat hypertasot
Logistinen regressio, separoivat hypertasot Topi Sikanen Logistinen regressio Aineisto jakautunut K luokkaan K=2 tärkeä erikoistapaus Halutaan mallintaa luokkien vedonlyöntikertoimia (odds) havaintojen
Lisätiedot1. Tutkitaan tavallista kahden selittäjän regressiomallia
TA7, Ekonometrian johdantokurssi HARJOITUS 5 RATKAISUEHDOTUKSET 232215 1 Tutkitaan tavallista kahden selittäjän regressiomallia Y i = β + β 1 X 1,i + β 2 X 2,i + u i (a) Kirjoita regressiomalli muodossa
LisätiedotKertaus. MS-C2128 Ennustaminen ja Aikasarja-analyysi, Heikki Seppälä
MS-C2128 Ennustaminen ja Aikasarja-analyysi, Heikki Seppälä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2015 Viikko 1: Yleinen lineaarinen malli 1 Määritelmä
LisätiedotTilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta
Tilastollisen analyysin perusteet Luento 1: ja hajonta Sisältö Havaittujen arvojen jakauma Havaittujen arvojen jakaumaa voidaan kuvailla ja esitellä tiivistämällä havaintoarvot sopivaan muotoon. Jakauman
LisätiedotTässä harjoituksessa käydään läpi R-ohjelman käyttöä esimerkkidatan avulla. eli matriisissa on 200 riviä (havainnot) ja 7 saraketta (mittaus-arvot)
R-ohjelman käyttö data-analyysissä Panu Somervuo 2014 Tässä harjoituksessa käydään läpi R-ohjelman käyttöä esimerkkidatan avulla. 0) käynnistetään R-ohjelma Huom.1 allaolevissa ohjeissa '>' merkki on R:n
Lisätiedot