LISÄTIEDON KÄYTTÖ ESTIMOINTIASETELMASSA: MALLIAVUSTEINEN ESTIMOINTI

Koko: px
Aloita esitys sivulta:

Download "LISÄTIEDON KÄYTTÖ ESTIMOINTIASETELMASSA: MALLIAVUSTEINEN ESTIMOINTI"

Transkriptio

1 Otatameetelmät (78143 Sysy 2010 TEEMA 2 risto.lehtoe@helsii.fi Teema 2 LISÄTIEDON KÄYTTÖ ESTIMOINTIASETELMASSA: MALLIAVUSTEINEN ESTIMOINTI 2 1

2 Lisätiedo äyttö estimoitiasetelmassa Malliavusteiset strategiat Model-assisted strategies Regressioestimoiti Suhde-estimoiti Jäliosittamie Kalibroitimeetelmät Otose ulopuolise lisäifo tuoti estimoitiasetelmaa tilastollise malli avulla SAS Procedure SURVEYREG SAS maro CLAN 3 Estimoitistrategioita perusjouo ooaismäärälle Strategia Lisäiformaatio Avustava malli Asetelmaperusteisia strategioita SRSWOR Ei ole Ei ole SRSWR Ei ole Ei ole STR Ositusmuuttuja Ei ole PPSWOR Koomuuttuja Ei ole Malliavusteisia strategioita Otata-asetelma SRS Avustava malli: Lieaarie iiteide teijöide malli Regressioestimoiti SRS*reg Jatuva Regressiomalli Suhde-estimoiti Jatuva Regressiomalli SRS*rat Jäliositus SRS*pos Disreetti (ei vaiotermiä ANOVA 4 2

3 Päämeetelmät Lisätiedo äyttö estimoitiasetelmassa Malliavusteie estimoiti Model assisted estimatio Yleistetyt regressioestimaattorit Geeralized regressio (GREG estimators Kalibroitimeetelmät Calibratio Mallista vapaa alibroiti Model-free calibratio Malliavusteie alibroiti Model calibratio 5 Malliavusteie estimoiti Ala lassio: Särdal C.-E, Swesso B. ad Wretma J. (1992. Model Assisted Survey Samplig. Spriger. Logistie regressioestimaattori LGREG: Lehtoe, R. ad A. Veijae (1998. Logistic geeralized regressio estimators. Survey Methodology 24, Sovellus osajouo- ja piealue-estimoitii: Lehtoe R. ad Veijae A. (2009. Desig-based Methods of Estimatio for Domais ad Small Areas. I: Hadboo of Statistics 29B; Sample Surveys: Iferece ad Aalysis. Eds. D. Pfefferma ad C.R. Rao. North Hollad. pp

4 GREG-estimaattoriperhe Malli valita GREG-estimaattorille Liearie iiteide teijöide malli - Liear fixed-effects model - Jatuva tulosmuuttuja Logistie iiteide teijöide malli - Biäärie/moiluoaie tulosmuuttuja Yleistetty lieaarie malli - Geeralized liear model Yleistetty lieaarie seamalli - Geeralized liear mixed model GLMM - Piealue-estimoiti (small area estimatio, SAE Hadboo of Statistics 7 GREG-estimaattori, te. tiivistelmä Sovellusalaa piealue-estimoiti U 1,2,...,,..., N Perusjouo (äärellie U 1,..., U d,..., U D Kiiostuse ohteea olevat pj: osajouot Otata-asetelma: PPS-WOR, otosoo s U sd = s Ud x1 π = x Otos Osajouoo d uuluva otos Sisältymist aliolle U PPS-otaassa = { } U 1 a = 1/ π Asetelmapaio aliolle s Tulosmuuttuja y havaitut arvot y aliolle s 8 4

5 Yleistetty lieaarie iiteide vaiutuste malli (1 Yhteie malli aiille osajouoille d E = x m( y f ( β missä f (. malli futioaalie muoto x = (1, x1,..., xp, U β = ( β β β 0, 1,..., p β j iiteät termit (yhteisiä aiille d j = 0,..., p Mallilla lasetut sovitteet yˆ = f( x βˆ, U 9 Yleistetty lieaarie iiteide vaiutuste malli (2 Osajouoohtaiset vaiotermit E ( y = f( x β m missä f (. malli futioaalie muoto x = ( I1,..., ID, x1,..., xp, U Id = 1 if Ud, Id = 0 muulloi, d = 1,..., D β = ( β 01,...,, β 0 D, β 1,...,, β p β0d osajouoohtaiset vaiotermit, d = 1,..., D β j yhteiset iiteät termit, j = 1,..., p Mallilla lasetut sovitteet yˆ = f( x βˆ, U 10 5

6 as(radom iterceptsoyleistetty lieaarie seamalli jouoohtaisetsatuaistermit( p E ( y u = f( x ( β + u, d = 1,..., D m d d missä f (. malli futioaalie muoto = (1, x,..., x x 1 p β = ( β, β,..., β iiteät termit u 0 1 p = ( u,..., u satuaistermit d 0d pd Mallilla lasetut sovitteet yˆ = f( x ( βˆ + uˆ, U d 11 Erioistapausia (1 Logistie iiteide teijöide malli E m exp( x β ( y = 1+ exp( x β exp( x βˆ Sovitteet yˆ =, U 1+ exp( x βˆ (2 Lieaarie seamalli, satuaiset vaiotermit E = m( y u xβ + u0d, d = 1,..., D d Sovitteet yˆ = x βˆ + ˆ u0d, U 12 6

7 Osajouoje totaalie GREG-estimaattori Totaaliparametrit Td = y, d = 1,..., D Ud Tulosmuuttuja y jatuva tai biäärie GREG-estimaattorit tˆ = yˆ + a eˆ dgreg U s missä a = 1/ π (asetelmapaiot eˆ = ˆ y y (jääöstermit eli residuaalit HUOM: Sovitteet ˆ lasetaa ulloisei malli avulla y d d 13 Kalibroiti Calibratio Mallista vapaa alibroiti Model-free calibratio Särdal C.-E, Swesso B. ad Wretma J. (1992. Model Assisted Survey Samplig. Spriger. Särdal, C.-E. (2007. The calibratio approach i survey theory ad practice. Survey Methodology 33, Malliavusteie alibroiti Model calibratio Lehtoe R., Särdal C.-E. ad Veijae A. (2008. Geeralized regressio ad model-calibratio estimatio for domais: Accuracy compariso. Ivited paper, BNU Worshop, August 2008, Kuressaare. 14 7

8 Mallista riippumato alibroiti Laseta SAS-maro CLAN (SCB, Ruotsi Adersso, C. ad L. Nordberg (1998. A User s Guide to CLAN 97 - a SAS-program for computatio of poit- ad stadard error estimates i sample surveys, Statistics Swede. SPSS-ohjelma g-calib (Belgia tilastovirasto SAS-maro CALMAR (INSEE; Rasa Bascula (CBS, Hollai tilastovirasto VLISS-esimeri Ks. jaettu moiste 15 Malliavusteie estimoiti ja alibroiti Materiaali Lehtoe ad Pahie (2004 Sectio Ratio estimatio of populatio total - Regressio estimatio of totals Teie yhteeveto 2 - Jaettu paperi VLISS - Traiig i Key Regressio estimatio - Mote Carlo simulatio - Traiig Key Calibratio of weights 16 8

9 TEKNINEN YHTEENVETO 2 Malliavusteie estimoiti Regressioestimoiti Oletetaa lieaarie regressiomalli (superpopulaatiomalli y = α + βz + ε, V( y 2 = σ (variassi Äärellise perusjouo vastieet parametreille α ja β ovat A ja B A ja B estimoidaa paiotetulla PNS-meetelmällä (WLS SRS-tilae: Kulmaertoime B estimaattori 2 b ˆ = sˆ yz / sˆ z Vaioparametri A estimaattori aˆ = y bz 17 Kooaismäärä T regressioestimaattori: tˆ reg = N( y + bˆ( Z z = tˆ + bˆ( T tˆ, missä z z o tulosmuuttuja y t ˆ = t ˆ = N y / π = N y / = Ny HT = 1 = 1 N = 1 ooaismäärä T = Y HT-estimaattori (SRSWOR, ˆ t / z = N z = Nz o apumuuttuja z ooaismäärä T z Z = Tz / = 1 N = 1 = Z HT-estimaattori (SRSWOR N Tarvittava lisätieto: Apumuuttuja ooaismäärä T z 18 9

10 Asetelmavariassi (liimääräie V ( ˆ SRS t ( 2 reg N 1 2 ( Sy ( yz N ρ 2 1 1, missä ρ = S / S S o muuttujie y ja z perusjouo orrelaatio yz yz y Variassiestimaattori (ysi vaihtoehto z ˆ ( ˆ ( v ( ˆ ( ˆ SRS treg = N 1 s y 1 ρ yz N 19 Moimuuttujaie regressiomalli y z z z missä z (1, = z1,..., zp β = ( β, β,..., β = β0 + β1 1 + β βp p + ε = zβ + ε 0 1 p Estimaattorit ja variassiestimaattorit Perusmuoto tˆ = tˆ + bˆ( T tˆ + bˆ ( T tˆ bˆ ( T tˆ (1 reg HT 1 z z 2 z z p z z p p 20 10

11 PROC SURVEYREG-muoto t ˆ = b ˆ N + bt ˆ + bt ˆ b ˆ T (2 reg 0 1 z 1 2 z 2 p z p proc surveyreg data=sample total=32; model UE91=HOU85 URB85 / solutio; weight SampligWeight; estimate t "UE91 Total" ru; Itercept 32 HOU URB85 7 / E; 21 missä GREG-muoto (Geeralized regressio estimator N tˆ = yˆ + w ( y yˆ reg = 1 = 1 (3 yˆ = zb ˆ HUOM: Termi Termi = 1 N yˆ Syteettie (malliperusteie = 1 w ( y yˆ totaali estimaattori Harha orjaustermi (jääöstotaali HT-estimaattori 22 11

12 Kalibroitiestimaattori * reg = w y (4 = 1 tˆ missä * w = g w o alibroitipaio w = 1/ π o asetelmapaio tl g o g-paio aliolle 23 Variassiestimaattorit vt ˆ( ˆ = N (1 / N(1/ s ˆ (5 reg 2 2 eˆ missä missä 2 2 eˆ = 1 sˆ = ( eˆ eˆ /( 1 eˆ = y yˆ eˆ = eˆ / = 1 yˆ = zb ˆ 24 12

13 ˆ 1 1 vt ˆ( (1 ( ( ˆ reg = N s N p 2 2 eˆ* (6 missä 2 * ˆ* e * 2 = 1 * = ˆ sˆ = ( eˆ eˆ /( 1 eˆ g e (g-paiotetut jääöset * * ˆ ˆ / = e e = 1 25 vt ˆ ˆ = N N sˆ Rˆ ( ( reg (1 / (1/ y (1 missä 2 ˆR o yhteisorrelaatioertoime eliö 2 2 sˆ y = ( y y /( 1 =

14 g-paiot Kalibroitimeetelmä (Calibratio Tulosmuuttuja y Kalibroitiestimaattori missä * reg w y = 1 tˆ =, w = g w, g o g-paio aliolle ja w = 1/ π * jolle pätee N * reg = = = z = 1 = 1 (alibroitiomiaisuus tˆ w z Z T 27 Suhde-estimoiti (Ratio estimatio Jatuva apumuuttuja z g T z = t ˆ z Regressioestimoiti (Regressio estimatio Jatuva apumuuttuja z N Z z g = (1 + ( z z Nˆ ( 1 sˆ z 28 14

15 Jäliositus (Poststratificatio Disreetti apumuuttuja (luoat g = 1,,G g g N g =, g = 1,..., G Nˆ g missä N ˆ g g = w o jäliosittee g estimoitu oo = 1 g 29 Regressioestimoiti - Esimeri Example 3.13 (Lehtoe Pahie 2004 Ysi apumuuttuja Populaatio Provice 91 Otosaieisto Aiaisemmi poimittu SRSWOR-otos, = 8 utaa Strategia SRS*reg 30 15

16 Tauluo Provice91- perusjouo N = 32 utaa Tulosmuuttuja UE91 Apumuuttujat STR osite - Kutamuoto HOU85 - Kotitalousie lm Lähde: Lehtoe R. ad Pahie E. (2004. Practical Methods for Desig ad Aalysis of Complex Surveys. Secod Editio. Wiley. 31 Table 3.16 A simple radom sample draw without replacemet from the Provice 91 populatio prepared for regressio estimatio Auxiliary iformatio Sample desig idetifiers WGHT Study Fial STR WGHT Elemet var. Variable Model w* LABEL UE91 HOU85 group g-weight weight 1 4 Jyväsylä Keuruu Saarijärvi Kogiagas Kuhmoie Pihtipudas Toivaa Uuraie Samplig rate = 8/32 =

17 Regressioestimoiti - Esimeri Tehdää regressioestimoiti ahdella tavalla (saadaa sama umeerie tulos Perusaava (1 Kalibroitiestimaattori (4 Variassiestimaattori (6 Tulosmuuttuja y UE91 Apumuuttuja z HOU85 (otitalousie lm uassa Regressioestimoiti - Esimeri Tauluo 3.16 Asetelmaidiaattorit vastaavat SRSWOR-tilaetta Poimitasuhde o Regressiomalli Selitettävä muuttuja UE91 Selittäjä HOU85 Estimoitu slope (ulmaerroi = Saadaa regressioestimaatti: tˆ = tˆ+ bˆ ( T tˆ reg z z = ( =

18 Regressioestimoiti - Esimeri Sama piste-estimaatti saadaa alibroitiestimaattorilla s. Paiot Table 3.16: 8 * t ˆ reg = w y 1 = = 35 Regressioestimoiti - Esimeri Variassiestimaatti Kaava (6 tuottaa tulosesi ˆ 1 1 ˆ ( (1 v t = N ( ( sˆ N p 2 2 srs reg eˆ* = 32 (1 ( ( =

19 Regressioestimoiti - Esimeri Laseta SAS Procedure SURVEYREG Laseta: Kaava (2 PROC SURVEYREG-muoto tˆ = bˆ N + bt ˆ + bt ˆ bˆ T (2 reg 0 1 z1 2 z2 p z p 37 Proc SURVEYREG **Regressio Estimatio; proc surveyreg data=sample total=32; title2 "Regressio estimatio for the total of UE91, auxiliary variable HOU85"; model UE91=HOU85 / solutio; weight SampligWeight; g estimate "UE91 Total" Itercept 32 HOU / E; ru; 38 19

20 Proc SURVEYREG Estimated Regressio Coefficiets Stadard Parameter Estimate Error t Value Pr > t Itercept HOU < Proc SURVEYREG Coefficiets of Estimate "UE91 Total" Effect Row 1 Itercept 32 HOU Aalysis of Estimable Fuctios Stadard Parameter Estimate Error t Value Pr > t UE91 Total <

21 Regressioestimoiti - Esimeri Kasi apumuuttujaa Populaatio Provice 91 Otosaieisto - Aiaisemmi poimittu SRSWOR-otos, = 8 utaa Strategia - SRS*reg Tulosmuuttuja y - UE91 Apumuuttujat z1 ja z2 HOU85 (otitalousie lm uassa 1985 URB85 (1 = aupugit, 0 = muut uat 41 Regressioestimoiti - Esimeri Regressiomalli Tulosmuuttuja y: UE91 Apumuuttujat z1: HOU85 z2: URB85 y = β + β z + β z + ε = z β + ε

22 Regressioestimoiti - Esimeri Laseta Perusaava (1 GREG-muoto (3 (Table 3.17 tˆ = tˆ + bˆ( T tˆ + bˆ ( T tˆ reg HT 1 z z 2 z z = ( (7 12 = Regressioestimoiti - Esimeri GREG-aava (Table 3.17 Tuottaa sama umeerise tulose (15152 ui (1 Variassiestimaatti lasetaa aavalla (6 GREG-muoto 32 8 tˆ = yˆ + w ( y yˆ = reg = 1 = 1 missä yˆ = ˆ zb z = (1, z1, z2 ' b ˆ = ( bˆ, bˆ, b ˆ

23 Regressioestimoiti - Esimeri Laseta Perusaava (1 - Lisäifo: Perusjouo totaalitiedot HOU85 ja URB85 GREG-aava (3 - Lisäifo: Ysiötaso tiedot perusjouo aiilta alioilta SAS-laseta 45 Proc SURVEYREG **Regressio Estimatio; proc surveyreg data=sample total=32; title2 "Regressio estimatio for the total of UE91, auxiliary variable HOU85 ad URB85"; model UE91=HOU85 URB85 / solutio; weight SampligWeight; estimate "UE91 Total" Itercept 32 HOU URB85 7 / E; ru; 46 23

24 Proc SURVEYREG Estimated Regressio Coefficiets Stadard Parameter Estimate Error t Value Pr > t Itercept HOU <.0001 URB Proc SURVEYREG Coefficiets of Estimate "UE91 Total" Effect Row 1 Itercept 32 HOU URB85 7 Aalysis of Estimable Fuctios Stadard Parameter Estimate Error t Value Pr > t UE91 Total <

25 Table 3.18 Estimates for the populatio total of UE91 uder differet estimatio strategies: a SRSWOR sample of eight elemets draw from the Provice 91 populatio. Estimatio strategy Estimator Estimate s.e deff Desig-based SRSWOR SRSWR Desig-based model-assisted Poststratified estimator SRS*pos Ratio SRS*rat estimator Regressio estimator oe z-variable SRS*reg, two z-variables SRS*reg, Kirjallisuutta OPPIKIRJOJA Särdal C.-E., Swesso B. ad Wretma J. (1992. Model Assisted Survey Samplig. New Yor: Spriger. Lehtoe R. ad Pahie E. (2004. Practical Methods for Desig ad Aalysis of Complex Surveys. 2d Editio. Chichester: Wiley. ARTIKKELEITA Lehtoe R., Särdal C.-E. ad Veijae A. (2003. The effect of model choice i estimatio for domais, icludig small domais. Survey Methodology, 29, Lehtoe R., Särdal C.-E. ad Veijae A. (2005. Does the model matter? Comparig model-assisted ad model-depedet estimators of class frequecies for domais. Statistics i Trasitio, 7, Lehtoe R. ad Veijae A. (2009. Desig-based methods of estimatio for domais ad small areas. Chapter 31 i Rao C.R. ad Pfefferma D. (Eds.. Hadboo of Statistics. Sample Surveys: Iferece ad Aalysis. Vol. 29B. New Yor: Elsevier. Lehtoe R. ad Veijae A. (1998. Logistic geeralized regressio estimators. Survey Methodology, 24,

Otantamenetelmät. Syksy

Otantamenetelmät. Syksy Otantamenetelmät (78143) Sysy 2009 TEEMA 2 risto.lehtonen@helsini.fi Teema 2 LISÄTIEDON KÄYTTÖ ESTIMOINTIASETELMASSA: MALLIAVUSTEINEN ESTIMOINTI 2 Lisätiedon äyttö estimointiasetelmassa i t Malliavusteiset

Lisätiedot

Otantamenetelmät (78143) Syksy 2008 OSA 2: Malliavusteinen estimointi. Risto Lehtonen

Otantamenetelmät (78143) Syksy 2008 OSA 2: Malliavusteinen estimointi. Risto Lehtonen Otantamenetelmät (78143) Sysy 2008 OSA 2: Malliavusteinen estimointi Risto Lehtonen risto.lehtonen@helsini.fi Lisätiedon äyttö estimointiasetelmassa Tavoitteena estimoinnin tehostaminen poimitulle otoselle

Lisätiedot

Uudelleenpainotus ja imputointi Perusteita

Uudelleenpainotus ja imputointi Perusteita Heisigi yliopisto Matematiia ja tilastotietee laitos Otatameetelmät Sysy 008 Uudelleepaiotus ja imputoiti Perusteita Prof. Risto Lehtoe, Helsigi yliopisto.1.008 Uudelleepaiotus Otostasoise tiedo äyttö

Lisätiedot

, sanotaan niiden sääntöjen ja menetelmien kokonaisuutta, joilla otos poimitaan määritellystä perusjoukosta.

, sanotaan niiden sääntöjen ja menetelmien kokonaisuutta, joilla otos poimitaan määritellystä perusjoukosta. Y - Otatameetelmät / Sysy 009 (Risto Letoe) TEKIE YTEEVETO I Otata-asetelmat ja estimoitiasetelmat Perusjouo ja muuttujat Äärellie perusjouo U = {,...,,..., } Tulosmuuttuja y tutemattomat arvot Y,,Y,,Y

Lisätiedot

Pienalue-estimointi (78189) Kevät 2011 Risto Lehtonen

Pienalue-estimointi (78189) Kevät 2011 Risto Lehtonen Helsingin yliopisto Sosiaalitieteien laitos 1 Pienalue-estimointi (78189) Kevät 2011 Risto Lehtonen OSA 3 GREG-estimaattori Yleinen tilanne (unequal probability sampling) Komposiittiestimaattorit (Composite

Lisätiedot

Pienalue-estimointi (78189) Kevät 2011 Risto Lehtonen

Pienalue-estimointi (78189) Kevät 2011 Risto Lehtonen Helsingin yliopisto Sosiaalitieteien laitos 1 Pienalue-estimointi (78189) Kevät 2011 Risto Lehtonen OSA 4 Laajennettu GREG-estimaattoreien perhe Avustavat mallit Yleistetty lineaarinen malli Lineaarinen

Lisätiedot

Pienalue-estimointi (78189) Kevät 2011 Risto Lehtonen

Pienalue-estimointi (78189) Kevät 2011 Risto Lehtonen Helsingin yliopisto Sosiaalitieteien laitos 1 Pienalue-estimointi (78189) Kevät 2011 Risto Lehtonen 15.3.2011 OSA 1 Estimaattorin tyyppi Mallin valinta Asetelmaperusteinen estimointi Horvitz-Thompson (HT)

Lisätiedot

Otanta-aineistojen analyysi (78136, 78405) Kevät 2010 TEEMA 4: Asetelmaperusteinen monimuuttuja-analyysi

Otanta-aineistojen analyysi (78136, 78405) Kevät 2010 TEEMA 4: Asetelmaperusteinen monimuuttuja-analyysi Otanta-aineistojen analyysi (78136, 78405) Kevät 2010 TEEMA 4: Asetelmaperusteinen monimuuttuja-analyysi Risto Lehtonen risto.lehtonen@helsini.fi Analyysimenetelmiä ja työaluja Lineaariset mallit Regressioanalyysi

Lisätiedot

Otanta-aineistojen analyysi (78136, 78405) Kevät 2010 TEEMA 3: Frekvenssiaineistojen asetelmaperusteinen analyysi: Perusteita

Otanta-aineistojen analyysi (78136, 78405) Kevät 2010 TEEMA 3: Frekvenssiaineistojen asetelmaperusteinen analyysi: Perusteita Otanta-aineistojen analyysi (78136, 78405) Kevät 2010 TEEMA 3: Frekvenssiaineistojen asetelmaperusteinen analyysi: Perusteita risto.lehtonen@helsinki.fi OHC Survey Tilastollinen analyysi Kysymys: Millä

Lisätiedot

(78143) Syksy 2009 TEEMAT 3 & 4. Risto Lehtonen Teema 3 ERITYISKYSYMYKSIÄ. Risto Lehtonen 2

(78143) Syksy 2009 TEEMAT 3 & 4. Risto Lehtonen Teema 3 ERITYISKYSYMYKSIÄ. Risto Lehtonen 2 Otantamenetelmät (78143) Syksy 2009 TEEMAT 3 & 4 Risto Lehtonen risto.lehtonen@helsinki.fi Teema 3 ERITYISKYSYMYKSIÄ Risto Lehtonen 2 1 Otannan erityiskysymyksiä Ryväsotanta Survey sampling reference guidelines

Lisätiedot

Pienalue-estimointi (78189) Kevät 2011. Risto Lehtonen Helsingin yliopisto

Pienalue-estimointi (78189) Kevät 2011. Risto Lehtonen Helsingin yliopisto Pienalue-estimointi (78189) Kevät 2011 Risto Lehtonen Helsingin yliopisto Pienalue-estimointi Kurssin kotisivu http://wiki.helsinki.fi/pages/viewpage.action?pagei=62430039 2 Hyöyllisiä taustatietoja Otantamenetelmät

Lisätiedot

Otanta-aineistojen analyysi

Otanta-aineistojen analyysi Helsingin yliopisto Otanta-aineistojen analyysi Kevät 2010 Periodi III Risto Lehtonen Teema 2 Estimaattoreiden varianssien estimointi Survey-analyysin lähestymistavat Kuvaileva survey Descriptive survey

Lisätiedot

Mat Tilastollisen analyysin perusteet, kevät 2007

Mat Tilastollisen analyysin perusteet, kevät 2007 Usea selittää lieaarie regressiomalli Mat-.04 Tilastollise aalyysi perusteet, evät 007 8. lueto: Usea selittää lieaarie regressiomalli Selitettävä muuttua havaittue arvoe vaihtelu halutaa selittää selittävie

Lisätiedot

JY / METODIFESTIVAALI 2013 PRE-KURSSI: KYSELYTUTKIMUS DEMOT

JY / METODIFESTIVAALI 2013 PRE-KURSSI: KYSELYTUTKIMUS DEMOT JY / METODIFESTIVAALI 2013 PRE-KURSSI: KYSELYTUTKIMUS DEMOT SPSS-ohjelmiston Complex Samples- toiminto otoksen poiminnassa ja estimaattien laskennassa Mauno Keto, lehtori Mikkelin AMK / Liiketalouden laitos

Lisätiedot

Otanta-aineistojen analyysi Kevät 2010 TEEMA 5: Tilastollinen mallinnus II Mallit, analyysimenetelmiä ja ohjelmia, PISA-esimerkki

Otanta-aineistojen analyysi Kevät 2010 TEEMA 5: Tilastollinen mallinnus II Mallit, analyysimenetelmiä ja ohjelmia, PISA-esimerkki Otanta-aineistojen analyysi Kevät 2010 TEEMA 5: Tilastollinen mallinnus II Mallit, analyysimenetelmiä ja ohjelmia, PISA-esimerkki risto.lehtonen@helsinki.fi Korreloituneiden havaintojen analyysi Lineaariset

Lisätiedot

Tilastollisten menetelmien käyttö Kelan tutkimustoiminnassa

Tilastollisten menetelmien käyttö Kelan tutkimustoiminnassa Tilastollisten menetelmien käyttö Kelan tutkimustoiminnassa Risto Lehtonen Helsingin yliopisto Kela 1 Tilastokeskuksen SAS-seminaari 16.11.2009 Aiheita Kelan tutkimustoiminta SAS-sovellukset vaativien

Lisätiedot

Mat Tilastollisen analyysin perusteet, kevät 2007

Mat Tilastollisen analyysin perusteet, kevät 2007 Mat-.104 Tilastollise aalyysi perusteet, kevät 007 6. lueto: Johdatus regressioaalyysii S ysteemiaalyysi Tekillie korkeakoulu Kai Virtae 1 Regressioaalyysi idea Tavoitteea selittää selitettävä tekiä/muuttua

Lisätiedot

Regressioanalyysi. Kuusinen/Heliövaara 1

Regressioanalyysi. Kuusinen/Heliövaara 1 Regressioanalyysi Kuusinen/Heliövaara 1 Regressioanalyysin idea ja tavoitteet Regressioanalyysin idea: Oletetaan, että haluamme selittää jonkin selitettävän muuttujan havaittujen arvojen vaihtelun joidenkin

Lisätiedot

Yleinen lineaarinen malli. Yleinen lineaarinen malli. Yleinen lineaarinen malli: Mitä opimme? 2/4. Yleinen lineaarinen malli: Mitä opimme?

Yleinen lineaarinen malli. Yleinen lineaarinen malli. Yleinen lineaarinen malli: Mitä opimme? 2/4. Yleinen lineaarinen malli: Mitä opimme? TKK (c) Ila Melli (004) Yleie lieaarie malli Johdatus tilastotieteesee Yleie lieaarie malli Usea selittää lieaarie regressiomalli Yleise lieaarise malli matriisisesitys Yleise lieaarise malli estimoiti

Lisätiedot

Regressioanalyysi. Vilkkumaa / Kuusinen 1

Regressioanalyysi. Vilkkumaa / Kuusinen 1 Regressioanalyysi Vilkkumaa / Kuusinen 1 Regressioanalyysin idea ja tavoitteet Regressioanalyysin idea: Halutaan selittää selitettävän muuttujan havaittujen arvojen vaihtelua selittävien muuttujien havaittujen

Lisätiedot

Johdatus regressioanalyysiin. Heliövaara 1

Johdatus regressioanalyysiin. Heliövaara 1 Johdatus regressioanalyysiin Heliövaara 1 Regressioanalyysin idea Oletetaan, että haluamme selittää jonkin selitettävän muuttujan havaittujen arvojen vaihtelun selittävien muuttujien havaittujen arvojen

Lisätiedot

SAS/IML käyttö ekonometristen mallien tilastollisessa päättelyssä. Antti Suoperä 16.11.2009

SAS/IML käyttö ekonometristen mallien tilastollisessa päättelyssä. Antti Suoperä 16.11.2009 SAS/IML käyttö ekonometristen mallien tilastollisessa päättelyssä Antti Suoperä 16.11.2009 SAS/IML käyttö ekonometristen mallien tilastollisessa päättelyssä: Matriisi ja vektori laskennan ohjelmisto edellyttää

Lisätiedot

ABHELSINKI UNIVERSITY OF TECHNOLOGY

ABHELSINKI UNIVERSITY OF TECHNOLOGY Johdatus regressioanalyysiin Regressioanalyysin idea Oletetaan, että haluamme selittää jonkin selitettävän muuttujan havaittujen arvojen vaihtelun selittävien muuttujien havaittujen arvojen vaihtelun avulla.

Lisätiedot

7. Lohkominen ja sulautus 2 k kokeissa. Lohkominen (Blocking)

7. Lohkominen ja sulautus 2 k kokeissa. Lohkominen (Blocking) 7. Lohkominen ja sulautus 2 k kokeissa Lohkominen (Blocking) Lohkotekijät muodostuvat faktoreista, joiden suhteen ei voida tehdä (täydellistä) satunnaistamista. Esimerkiksi faktorikokeessa raaka-aine-erät

Lisätiedot

Mat Tilastollisen analyysin perusteet, kevät 2007

Mat Tilastollisen analyysin perusteet, kevät 2007 Mat-.104 Tilastollisen analyysin perusteet, kevät 007 8. luento: Usean selittäjän lineaarinen regressiomalli Kai Virtanen 1 Usean selittäjän lineaarinen regressiomalli Selitettävän muuttujan havaittujen

Lisätiedot

Kulutustutkimuksen alue-estimointi Pienalue-estimointimenetelmien vertailu Kulutustutkimus aineistossa

Kulutustutkimuksen alue-estimointi Pienalue-estimointimenetelmien vertailu Kulutustutkimus aineistossa Kulutustutkimuksen alue-estimointi Pienalue-estimointimenetelmien vertailu Kulutustutkimus 2006 -aineistossa Pauliina Maria Peltonen Helsingin yliopisto Matemaattis-luonnontieteellinen tiedekunta Tilastotiede

Lisätiedot

Otantamenetelmät. (78143) Syksy 2010 TEEMA 1. Risto Lehtonen

Otantamenetelmät. (78143) Syksy 2010 TEEMA 1. Risto Lehtonen Otantamenetelmät (78143) Syksy 2010 TEEMA 1 Risto Lehtonen risto.lehtonen@helsinki.fi Otantamenetelmät Luennot Tiistaisin klo 14 18 2.-30.11.2010 (Exactum), yhteensä 20 tuntia. Harjoitukset Torstaisin

Lisätiedot

proc glm data = ex61; Title2 "Aliasing Structure of the 2_IV^(5-1) design"; model y = A B C D E /Aliasing; run; quit;

proc glm data = ex61; Title2 Aliasing Structure of the 2_IV^(5-1) design; model y = A B C D E /Aliasing; run; quit; Title "Exercises 6"; Data ex61; input A B C D E y @@; Label A = "Furnance Temperature" B = "Heating Time" C = "Transfer Time" D = "Hold Down Time" E = "Quench of Oil Temperature" y = "Free Height of Leaf

Lisätiedot

Yhden selittäjän lineaarinen regressiomalli

Yhden selittäjän lineaarinen regressiomalli Ilkka Melli Tilastolliset meetelmät Osa 4: Lieaarie regressioaalyysi Yhde selittäjä lieaarie regressiomalli TKK (c) Ilkka Melli (007) Yhde selittäjä lieaarie regressiomalli >> Yhde selittäjä lieaarie regressiomalli

Lisätiedot

ATH-aineiston tilastolliset analyysit SPSS/PASW SPSS analyysit / Risto Sippola 1

ATH-aineiston tilastolliset analyysit SPSS/PASW SPSS analyysit / Risto Sippola 1 ATH-aineiston tilastolliset analyysit SPSS/PASW 16.2.2011 SPSS analyysit / Risto Sippola 1 Aineiston avaaminen Aineisto on saatu SPSS-muotoon ja tallennettu koneelle sijaintiin, josta sitä voidaan käyttää

Lisätiedot

Health 2000/2011 Surveys. Statistical Analysis using SAS and SAS-Callable SUDAAN Packages 17.6.2013. Esa Virtala. etunimi.sukunimi@thl.

Health 2000/2011 Surveys. Statistical Analysis using SAS and SAS-Callable SUDAAN Packages 17.6.2013. Esa Virtala. etunimi.sukunimi@thl. Health 2000/2011 Surveys Statistical Analysis using SAS and SAS-Callable SUDAAN Packages 17.6.2013 Esa Virtala etunimi.sukunimi@thl.fi Terveyden ja hyvinvoinnin laitos (THL) PL 30 00271 Helsinki Puhelin:

Lisätiedot

Lohkotekijät muodostuvat faktoreista, joiden suhteen ei voida tehdä (täydellistä) satunnaistamista.

Lohkotekijät muodostuvat faktoreista, joiden suhteen ei voida tehdä (täydellistä) satunnaistamista. 7. Lohkominen ja sulautus 2 k kokeissa Lohkominen (Blocking) Lohkotekijät muodostuvat faktoreista, joiden suhteen ei voida tehdä (täydellistä) satunnaistamista. Esimerkiksi faktorikokeessa raaka-aine-erät

Lisätiedot

Hierarkkisen aineiston mallintaminen ja otanta/pre-kurssi

Hierarkkisen aineiston mallintaminen ja otanta/pre-kurssi Hierarkkisen aineiston mallintaminen ja otanta/pre-kurssi Risto Lehtonen, Helsingin yliopisto Metodifestivaali Jyväskylän yliopisto 27.5.2009 Keskiviikko 27.5 10-12 Hierarkkisuus otanta- asetelmaperusteisessa

Lisätiedot

Harha mallin arvioinnissa

Harha mallin arvioinnissa Esitelmä 12 Antti Toppila sivu 1/18 Optimointiopin seminaari Syksy 2010 Harha mallin arvioinnissa Antti Toppila 13.10.2010 Esitelmä 12 Antti Toppila sivu 2/18 Optimointiopin seminaari Syksy 2010 Sisältö

Lisätiedot

Estimaattoreiden asetelmaperusteinen

Estimaattoreiden asetelmaperusteinen Otanta-aineistojen aineistojen analyysi (78136, 78405) Kevät 2010 TEEMA 2: Estimaattoreiden varianssin estimointi Risto Lehtonen risto.lehtonen@helsinki.fi Estimaattoreiden asetelmaperusteinen varianssien

Lisätiedot

Yhden selittäjän lineaarinen regressiomalli (jatkoa) Ensi viikolla ei pidetä luentoa eikä harjoituksia. Heliövaara 1

Yhden selittäjän lineaarinen regressiomalli (jatkoa) Ensi viikolla ei pidetä luentoa eikä harjoituksia. Heliövaara 1 Yhden selittäjän lineaarinen regressiomalli (jatkoa) Ensi viikolla ei pidetä luentoa eikä harjoituksia Heliövaara 1 Regressiokertoimien PNS-estimaattorit Määritellään havaintojen x j ja y j, j = 1, 2,...,n

Lisätiedot

7. Lohkominen ja sulautus 2 k kokeissa. Lohkominen (Blocking)

7. Lohkominen ja sulautus 2 k kokeissa. Lohkominen (Blocking) 7. Lohkominen ja sulautus 2 k kokeissa Lohkominen (Blocking) Lohkotekijät muodostuvat faktoreista, joiden suhteen ei voida tehdä (täydellistä) satunnaistamista. Esimerkiksi faktorikokeessa raaka-aine-erät

Lisätiedot

Jakaumien merkitys biologisissa havaintoaineistoissa: Löytyykö ratkaisu Yleistetyistä Lineaarisista (Seka)Malleista?

Jakaumien merkitys biologisissa havaintoaineistoissa: Löytyykö ratkaisu Yleistetyistä Lineaarisista (Seka)Malleista? 1 Hydrobiologian tutkijaseminaari 20.3.2000 Jakaumien merkitys biologisissa havaintoaineistoissa: Löytyykö ratkaisu Yleistetyistä Lineaarisista (Seka)Malleista? Jari Hänninen Turun yliopisto Saaristomeren

Lisätiedot

2.1. Parametrien estimointi 2.2. Regressiokertoimien estimointi kovariansseista ja korrelaatioista

2.1. Parametrien estimointi 2.2. Regressiokertoimien estimointi kovariansseista ja korrelaatioista Moimuuttujameetelmät: Ilkka Melli. Yleise lieaarise malli määrittelemie.. ja malli oletukset.. Yleise lieaarise malli matriisiesitys. Yleise lieaarise malli parametrie estimoiti.. Parametrie estimoiti..

Lisätiedot

1. Tutkitaan regressiomallia Y i = β 0 + β 1 X i + u i ja oletetaan, että tavanomaiset

1. Tutkitaan regressiomallia Y i = β 0 + β 1 X i + u i ja oletetaan, että tavanomaiset TA7, Ekonometrian johdantokurssi HARJOITUS 7 RATKAISUEHDOTUKSET 16.3.2015 1. Tutkitaan regressiomallia Y i = β 0 + X i + u i ja oletetaan, että tavanomaiset regressiomallin oletukset pätevät (Key Concept

Lisätiedot

TA7, Ekonometrian johdantokurssi HARJOITUS 4 1 RATKAISUEHDOTUKSET

TA7, Ekonometrian johdantokurssi HARJOITUS 4 1 RATKAISUEHDOTUKSET TA7, Ekonometrian johdantokurssi HARJOITUS 4 1 RATKAISUEHDOTUKSET 16..015 1. a Poliisivoimien suuruuden lisäksi piirikuntien rikostilastoihin vaikuttaa monet muutkin tekijät. Esimerkiksi asukkaiden keskimääräinen

Lisätiedot

19. Statistical Approaches to. Data Variations Tuomas Koivunen S ysteemianalyysin. Laboratorio. Optimointiopin seminaari - Syksy 2007

19. Statistical Approaches to. Data Variations Tuomas Koivunen S ysteemianalyysin. Laboratorio. Optimointiopin seminaari - Syksy 2007 19. Statistical Approaches to Data Variations Tuomas Koivunen 24.10.2007 Contents 1. Production Function 2. Stochastic Frontier Regressions 3. Example: Study of Texas Schools 4. Example Continued: Simulation

Lisätiedot

Otanta-aineistojen analyysi

Otanta-aineistojen analyysi Helsingin yliopisto Otanta-aineistojen analyysi Kevät 2010 Periodi III Risto Lehtonen Teema 4 Asetelmaperusteinen monimuuttujaanalyysi Logistinen ANOVA ja GWLS-estimointi Binäärinen tulosmuuttuja Diskreetit

Lisätiedot

Otanta-aineistojen analyysi

Otanta-aineistojen analyysi Otanta-aineistojen analyysi (78136, 78405) Kevät 2010 TEEMA 1 Risto Lehtonen risto.lehtonen@helsinki.fi Otanta-aineistojen analyysi Laajuus 6/8 op. Tyyppi 78136 Otanta-aineistojen analyysi (aineopintojen

Lisätiedot

Estimointi populaation tuntemattoman parametrin arviointia otossuureen avulla Otossuure satunnaisotoksen avulla määritelty funktio

Estimointi populaation tuntemattoman parametrin arviointia otossuureen avulla Otossuure satunnaisotoksen avulla määritelty funktio 17.11.2015/1 MTTTP5, luento 17.11.2015 Luku 5 Parametrien estimointi 5.1 Piste-estimointi Estimointi populaation tuntemattoman parametrin arviointia otossuureen avulla Otossuure satunnaisotoksen avulla

Lisätiedot

A250A0050 Ekonometrian perusteet Tentti

A250A0050 Ekonometrian perusteet Tentti A250A0050 Ekonometrian perusteet Tentti 28.9.2016 Tentissä ei saa käyttää laskinta. Tentistä saa max 80 pistettä. Hyväksytysti suoritetusta harjoitustyöstä saa max 20 pistettä. Huom. Merkitse vastauspaperin

Lisätiedot

Mat Tilastollisen analyysin perusteet, kevät 2007

Mat Tilastollisen analyysin perusteet, kevät 2007 Mat-.14 Tilastollisen analyysin perusteet, kevät 7 7. luento: Tarina yhden selittään lineaarisesta regressiomallista atkuu Kai Virtanen 1 Luennolla 6 opittua Kuvataan havainnot (y, x ) yhden selittään

Lisätiedot

Perusestimointi 5 Analyysiä survey-datalla Tee Suomen datalla jokin oma kokeilu käyttäen tätä mallia Esimerkki PISA 2006:sta SAS:lla

Perusestimointi 5 Analyysiä survey-datalla Tee Suomen datalla jokin oma kokeilu käyttäen tätä mallia Esimerkki PISA 2006:sta SAS:lla Perusestimointi 5 Analyysiä survey-datalla Tee Suomen datalla jokin oma kokeilu käyttäen tätä mallia Esimerkki PISA 2006:sta SAS:lla proc surveymeans data=pisa.impuoecd; where cnt='fin' or cnt='deu' or

Lisätiedot

9 Lukumäärien laskemisesta

9 Lukumäärien laskemisesta 9 Luumäärie lasemisesta 9 Biomiertoimet ja osajouoje luumäärä Määritelmä 9 Oletetaa, että, N Biomierroi ilmaisee, uia mota -alioista osajouoa o sellaisella jouolla, jossa o aliota Meritä luetaa yli Lasimesta

Lisätiedot

HY, MTO / Matemaattisten tieteiden kandiohjelma Tilastollinen päättely II, kevät 2018 Harjoitus 6A Ratkaisuehdotuksia.

HY, MTO / Matemaattisten tieteiden kandiohjelma Tilastollinen päättely II, kevät 2018 Harjoitus 6A Ratkaisuehdotuksia. HY, MTO / Matemaattiste tieteide adiohjelma Tilastollie päättely II, evät 2018 Harjoitus 6A Rataisuehdotusia Tehtäväsarja I 1. (Moistee tehtävä 5.4) Kauppias myy mäysiemeiä, joide itävyyde väitetää oleva

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 22. marraskuuta 2007 Antti Rasila () TodB 22. marraskuuta 2007 1 / 17 1 Epäparametrisia testejä (jatkoa) χ 2 -riippumattomuustesti 2 Johdatus regressioanalyysiin

Lisätiedot

Esim Brand lkm keskiarvo keskihajonta A ,28 5,977 B ,06 3,866 C ,95 4,501

Esim Brand lkm keskiarvo keskihajonta A ,28 5,977 B ,06 3,866 C ,95 4,501 Esim. 2.1.1. Brand lkm keskiarvo keskihajonta A 10 251,28 5,977 B 10 261,06 3,866 C 10 269,95 4,501 y = 260, 76, n = 30 SS 1 = (n 1 1)s 2 1 = (10 1)5, 977 2 321, 52 SS 2 = (n 2 1)s 2 2 = (10 1)3, 8662

Lisätiedot

Tilastollisen analyysin perusteet Luento 7: Lineaarinen regressio

Tilastollisen analyysin perusteet Luento 7: Lineaarinen regressio Tilastollisen analyysin perusteet Luento 7: Lineaarinen regressio Sisältö Regressioanalyysissä tavoitteena on tutkia yhden tai useamman selittävän muuttujan vaikutusta selitettävään muuttujaan. Sen avulla

Lisätiedot

Lähtökohta: k faktoria, kullakin kaksi tasoa ("high", "low"). tulee katettua (complete replicate). Havaintojen

Lähtökohta: k faktoria, kullakin kaksi tasoa (high, low). tulee katettua (complete replicate). Havaintojen 6. 2 k faktorikokeet Lähtökohta: k faktoria, kullakin kaksi tasoa ("high", "low"). Vähintään 2 k havaintoa, jotta kaikki vaihtoehdot tulee katettua (complete replicate). Havaintojen kokonaismäärä N = 2

Lisätiedot

Yhden selittäjän lineaarinen regressiomalli: Lisätiedot. Yhden selittäjän lineaarinen regressiomalli

Yhden selittäjän lineaarinen regressiomalli: Lisätiedot. Yhden selittäjän lineaarinen regressiomalli TKK (c) Ilkka Melli (4) Yhde selittää lieaarie regressiomalli Johdatus tilastotieteesee Yhde selittää lieaarie regressiomalli Yhde selittää lieaarie regressiomalli a sitä koskevat oletukset Yhde selittää

Lisätiedot

Graph. COMPUTE x=rv.normal(0,0.04). COMPUTE y=rv.normal(0,0.04). execute.

Graph. COMPUTE x=rv.normal(0,0.04). COMPUTE y=rv.normal(0,0.04). execute. COMPUTE x=rv.ormal(0,0.04). COMPUTE y=rv.ormal(0,0.04). execute. compute hplib_man_r = hplib_man + x. compute arvokons_man_r = arvokons_man + y. GRAPH /SCATTERPLOT(BIVAR)=hplib_man_r WITH arvokons_man_r

Lisätiedot

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0501 Todeäköisyyslaskea ja tilastotietee peruskurssi 4A Satuaisotata ja parametrie estimoiti Lasse Leskelä Matematiika ja systeemiaalyysi laitos Perustieteide korkeakoulu Aalto-yliopisto Syksy 2016,

Lisätiedot

LASKENNALLISEN TIETEEN ERIKOISKURSSI kl 2000

LASKENNALLISEN TIETEEN ERIKOISKURSSI kl 2000 LASKENNALLISEN TIETEEN ERIKOISKURSSI kl 2000 Laskuharjoitus Detaljibalassi Osoita, että siirtymätodeäköisyydet π m α m ; ρ, m ρ α m ----- ; ρ < ρ, m m π m, m m ja π m ρ α m ------------------ ρ +, m π

Lisätiedot

Tilastollisen analyysin perusteet Luento 9: Moniulotteinen lineaarinen. regressio

Tilastollisen analyysin perusteet Luento 9: Moniulotteinen lineaarinen. regressio Tilastollisen analyysin perusteet Luento 9: lineaarinen lineaarinen Sisältö lineaarinen lineaarinen lineaarinen Lineaarinen Oletetaan, että meillä on n kappaletta (x 1, y 1 ), (x 2, y 2 )..., (x n, y n

Lisätiedot

Ilkka Mellin Tilastolliset menetelmät. Osa 4: Lineaarinen regressioanalyysi. Yleinen lineaarinen malli. TKK (c) Ilkka Mellin (2007) 1

Ilkka Mellin Tilastolliset menetelmät. Osa 4: Lineaarinen regressioanalyysi. Yleinen lineaarinen malli. TKK (c) Ilkka Mellin (2007) 1 Ilkka Mellin Tilastolliset menetelmät Osa 4: Lineaarinen regressioanalyysi Yleinen lineaarinen malli TKK (c) Ilkka Mellin (2007) 1 Yleinen lineaarinen malli >> Usean selittäjän lineaarinen regressiomalli

Lisätiedot

Johdatus tilastotieteeseen Yleinen lineaarinen malli. TKK (c) Ilkka Mellin (2004) 1

Johdatus tilastotieteeseen Yleinen lineaarinen malli. TKK (c) Ilkka Mellin (2004) 1 Johdatus tilastotieteeseen Yleinen lineaarinen malli TKK (c) Ilkka Mellin (2004) 1 Yleinen lineaarinen malli Usean selittäjän lineaarinen regressiomalli Yleisen lineaarisen mallin matriisisesitys Yleisen

Lisätiedot

[MTTTA] TILASTOMENETELMIEN PERUSTEET, KEVÄT 209 https://coursepages.uta.fi/mttta/kevat-209/ HARJOITUS 5 viikko 8 RYHMÄT: ke 2.5 3.45 ls. C6 Leppälä to 08.30 0.00 ls. C6 Korhonen to 2.5 3.45 ls. C6 Korhonen

Lisätiedot

Keskipisteen lisääminen 2 k -faktorikokeeseen (ks. Montgomery 9-6)

Keskipisteen lisääminen 2 k -faktorikokeeseen (ks. Montgomery 9-6) Mat-.3 Koesuunnittelu ja tilastolliset mallit kevät Keskipisteen lisääminen k -faktorikokeeseen (ks. Montgomery 9-6) Esim (Montg. ex. 9-, 6-): Tutkitaan kemiallisen prosessin saannon Y riippuvuutta faktoreista

Lisätiedot

C (4) 1 x + C (4) 2 x 2 + C (4)

C (4) 1 x + C (4) 2 x 2 + C (4) http://matematiialehtisolmu.fi/ Kombiaatio-oppia Kuia mota erilaista lottoriviä ja poeriättä o olemassa? Lotossa arvotaa 7 palloa 39 pallo jouosta. Poeriäsi o viide orti osajouo 52 orttia äsittävästä paasta.

Lisätiedot

Tilastolliset menetelmät: Varianssianalyysi

Tilastolliset menetelmät: Varianssianalyysi Variassiaalsi Tilastolliset meetelmät: Variassiaalsi 0. Ysisuutaie variassiaalsi. asisuutaie variassiaalsi. olmi a useampisuutaie variassiaalsi T @ Ila Melli (006) 433 Variassiaalsi T @ Ila Melli (006)

Lisätiedot

9.1 Hierarkiset asetelmat (Nested Designs)

9.1 Hierarkiset asetelmat (Nested Designs) 9. Muita koeasetelmia 9.1 Hierarkiset asetelmat (Nested Designs) Tietyissä koetilanteissa yhden faktorin tasot ovat samanlaisia joskaan ei täysin identtisiä toisen faktorin eri tasoilla. Tällaista asetelmaa

Lisätiedot

Sisältö. Kvantitatiivinen metodologia verkossa. Monitasomallintaminen. Monitasomallit. Regressiomalli dummy-muuttujilla.

Sisältö. Kvantitatiivinen metodologia verkossa. Monitasomallintaminen. Monitasomallit. Regressiomalli dummy-muuttujilla. Kvatitatiivie metodologia verkossa Moitasomallius Pekka Ratae Helsigi yliopisto isältö Moitasomallit Matemaattisia peruskäsitteitä Esimerkki kovariassista Otatavirhe Esimerkki elittävie muuttujie lisäämie

Lisätiedot

Kaksisuuntaisen varianssianalyysin tilastollisessa malli voidaan esittää seuraavassa muodossa:

Kaksisuuntaisen varianssianalyysin tilastollisessa malli voidaan esittää seuraavassa muodossa: Mat-.03 Koesuunnittelu ja tilastolliset mallit Mat-.03 Koesuunnittelu ja tilastolliset mallit / Ratkaisut Aiheet: Avainsanat: Kaksisuuntainen varianssianalsi Aritmeettinen keskiarvo, Estimointi, F-testi,

Lisätiedot

8.3. Yleinen lineaarinen malli ja yleistetty pienimmän neliösumman menetelmä

8.3. Yleinen lineaarinen malli ja yleistetty pienimmän neliösumman menetelmä Mat-1.361 Tilastollie päättely Tilastollie päättely 8. Yleie lieaarie malli 8.1. Yleie lieaarie malli ja se parametrie estimoiti Estimoiti, Estimaattori hyvyys, Gaussi ja Markovi lause, Harhattomuus, Homoskedastisuus,

Lisätiedot

4.7 Todennäköisyysjakaumia

4.7 Todennäköisyysjakaumia MAB5: Todeäöisyyde lähtöohdat.7 Todeäöisyysjaaumia Luvussa 3 Tuusluvut perehdyimme jo jaauma äsitteesee yleesä ja ormaalijaaumaa vähä taremmi. Lähdetää yt tutustumaa biomijaaumaa ja otetaa se jälee ormaalijaauma

Lisätiedot

Mat Tilastollisen analyysin perusteet, kevät 2007

Mat Tilastollisen analyysin perusteet, kevät 2007 Mat-.4 Tilastollise aalyysi perusteet, kevät 7 9. lueto: Regressiomalli validoiti Kai Virtae Regressiomalli validoiista Estimoitu hieo regressiomalli: Kuvaako malli tutkittavaa ilmiötä oikei? Kuika hyvi

Lisätiedot

Alternative DEA Models

Alternative DEA Models Mat-2.4142 Alternative DEA Models 19.9.2007 Table of Contents Banker-Charnes-Cooper Model Additive Model Example Data Home assignment BCC Model (Banker-Charnes-Cooper) production frontiers spanned by convex

Lisätiedot

2. Teoriaharjoitukset

2. Teoriaharjoitukset 2. Teoriaharjoitukset Demotehtävät 2.1 Todista Gauss-Markovin lause. Ratkaisu. Oletetaan että luentokalvojen standardioletukset (i)-(v) ovat voimassa. Huomaa että Gauss-Markovin lause ei vaadi virhetermien

Lisätiedot

MS-A0402 Diskreetin matematiikan perusteet

MS-A0402 Diskreetin matematiikan perusteet MS-A0402 Disreetin matematiian perusteet Osa 3: Kombinatoriia Riia Kangaslampi 2017 Matematiian ja systeemianalyysin laitos Aalto-yliopisto Kombinatoriia Summaperiaate Esimeri 1 Opetusohjelmaomiteaan valitaan

Lisätiedot

Erityiskysymyksiä yleisen lineaarisen mallin soveltamisessa

Erityiskysymyksiä yleisen lineaarisen mallin soveltamisessa Ilkka Mellin Tilastolliset menetelmät Osa 4: Lineaarinen regressioanalyysi Erityiskysymyksiä yleisen lineaarisen mallin soveltamisessa TKK (c) Ilkka Mellin (2007) 1 Erityiskysymyksiä yleisen lineaarisen

Lisätiedot

1. YKSISUUNTAINEN VARIANSSIANALYYSI: AINEISTON ESITYSMUODOT

1. YKSISUUNTAINEN VARIANSSIANALYYSI: AINEISTON ESITYSMUODOT Mat-2.104 Tilastollisen analyysin perusteet / Ratkaisut Aiheet: Avainsanat: Yksisuuntainen varianssianalyysi Bartlettin testi, Bonferronin menetelmä, F-testi, Jäännösneliösumma, χ 2 -testi, Kokonaiskeskiarvo,

Lisätiedot

Olkoot X ja Y riippumattomia satunnaismuuttujia, joiden odotusarvot, varianssit ja kovarianssi ovat

Olkoot X ja Y riippumattomia satunnaismuuttujia, joiden odotusarvot, varianssit ja kovarianssi ovat Mat-.3 Koesuunnittelu ja tilastolliset mallit. harjoituset Mat-.3 Koesuunnittelu ja tilastolliset mallit. harjoituset / Rataisut Aiheet: Avainsanat: Satunnaismuuttujat ja todennäöisyysjaaumat Kertymäfuntio

Lisätiedot

KURSSIN TILASTOMATEMATIIKKA KAAVOJA

KURSSIN TILASTOMATEMATIIKKA KAAVOJA KURSSIN TILASTOMATEMATIIKKA KAAVOJA X = S = s = Otossuureita X i tai x = x i (otoskeskiarvo) (X i X) = (x i x) = Xi x i E(X) =µ, var(x) = σ X x tai, E(S )=σ (otosvariassi) Normaalijakautuee populaatio

Lisätiedot

1. PÄÄTTELY YHDEN SELITTÄJÄN LINEAARISESTA REGRESSIOMALLISTA

1. PÄÄTTELY YHDEN SELITTÄJÄN LINEAARISESTA REGRESSIOMALLISTA Mat-2.104 Tilastollisen analyysin perusteet / Ratkaisut Aiheet: Avainsanat Päättely yhden selittäjän lineaarisesta regressiomallista Ennustaminen, Ennuste, Ennusteen luottamusväli, Estimaatti, Estimaattori,

Lisätiedot

Teknillinen tiedekunta, matematiikan jaos Numeeriset menetelmät

Teknillinen tiedekunta, matematiikan jaos Numeeriset menetelmät Numeeriset menetelmät 1. välikoe, 14.2.2009 1. Määrää matriisin 1 1 a 1 3 a a 4 a a 2 1 LU-hajotelma kaikille a R. Ratkaise LU-hajotelmaa käyttäen yhtälöryhmä Ax = b, missä b = [ 1 3 2a 2 a + 3] T. 2.

Lisätiedot

Aalto-yliopisto, Matematiikan ja systeemianalyysin laitos /Malmivuori MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi,

Aalto-yliopisto, Matematiikan ja systeemianalyysin laitos /Malmivuori MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi, Aalto-yliopisto, Matematiikan ja systeemianalyysin laitos /Malmivuori MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi, kesä 2016 Laskuharjoitus 5, Kotitehtävien palautus laskuharjoitusten

Lisätiedot

Lineaaristen mallien sovellukset -harjoitustyö

Lineaaristen mallien sovellukset -harjoitustyö Lineaaristen mallien sovellukset -harjoitustyö Juha-Pekka Perttola 8. tammikuuta 2006 Sisältö 1 Johdanto 4 1.1 Perustiedot käytetystä aineistosta................ 4 1.2 Harjoitustyön tavoite.......................

Lisätiedot

810 Tilastolliste meetelmie perusteet II (TILTP3), Kevät 00 http://wwwutafi/~strale/p3alkuhtml 600 500 Huom 1 Dokumeti lopussa o kirjallisuusluettelo, joka sisältäviä teoksia o käytetty tukea tämä luetorugo

Lisätiedot

1. REGRESSIOMALLIN SYSTEMAATTISEN OSAN MUOTO

1. REGRESSIOMALLIN SYSTEMAATTISEN OSAN MUOTO Mat-2.104 Tilastollisen analyysin perusteet / Ratkaisut Aiheet: Avainsanat: Regressiodiagnostiikka Cooken etäisyys, Funktionaalinen muoto, Diagnostinen grafiikka, Diagnostiset testit, Heteroskedastisuus,

Lisätiedot

Harjoitusten 4 vastaukset

Harjoitusten 4 vastaukset Harjoitusten 4 vastaukset 4.1. Prosessi on = 1 +, jossa»iid( 2 )ja =1 2. PNS estimaattori :lle on (" P P 2 ") = +( X X 2 ) 1 1. =1 Suluissa oleva termi on deterministinen ja suppenee vihjeen mukaan 2 6:teen.

Lisätiedot

E80. Data Uncertainty, Data Fitting, Error Propagation. Jan. 23, 2014 Jon Roberts. Experimental Engineering

E80. Data Uncertainty, Data Fitting, Error Propagation. Jan. 23, 2014 Jon Roberts. Experimental Engineering Lecture 2 Data Uncertainty, Data Fitting, Error Propagation Jan. 23, 2014 Jon Roberts Purpose & Outline Data Uncertainty & Confidence in Measurements Data Fitting - Linear Regression Error Propagation

Lisätiedot

805306A Johdatus monimuuttujamenetelmiin, 5 op

805306A Johdatus monimuuttujamenetelmiin, 5 op monimuuttujamenetelmiin, 5 op syksy 2018 Matemaattisten tieteiden laitos Logistinen regressioanalyysi Vastemuuttuja Y on luokiteltu muuttuja Pyritään mallittamaan havaintoyksikön todennäköisyyttä kuulua

Lisätiedot

S Laskennallinen systeemibiologia

S Laskennallinen systeemibiologia S-4250 Laskeallie systeemibiologia Harjoitus Mittaustuloksea o saatu havaitoparia (x, y ),, (x, y ) Muuttuja y käyttäytymistä voidaa selittää muuttuja x avulla esimerkiksi yksikertaise lieaarise riippuvuude

Lisätiedot

Osa 2: Otokset, otosjakaumat ja estimointi

Osa 2: Otokset, otosjakaumat ja estimointi Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi TKK (c) Ilkka Mellin (2007) 1 Estimointi >> Todennäköisyysjakaumien parametrit ja niiden estimointi Hyvän estimaattorin

Lisätiedot

Otanta-aineistojen analyysi

Otanta-aineistojen analyysi Helsingin yliopisto Otanta-aineistojen analyysi Kevät 2010 Periodi III Risto Lehtonen Teema 3 Frekvenssiaineistojen asetelmaperusteinen analyysi: Perusteita Johdattava esimerkki - Yksinkertainen yhteensopivuustesti

Lisätiedot

/1. MTTTP1, luento Normaalijakauma (jatkoa) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti:

/1. MTTTP1, luento Normaalijakauma (jatkoa) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti: 4.10.2016/1 MTTTP1, luento 4.10.2016 7.4 Normaalijakauma (jatkoa) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti: Samoin z /2 siten, että P(Z > z /2 ) = /2, graafisesti: 4.10.2016/2

Lisätiedot

Kaksitasoiset hierarkiset asetelmat (Two-Stage Nested Designs) 9. Muita koeasetelmia. 9.1 Hierarkiset asetelmat (Nested Designs)

Kaksitasoiset hierarkiset asetelmat (Two-Stage Nested Designs) 9. Muita koeasetelmia. 9.1 Hierarkiset asetelmat (Nested Designs) 9. Muita koeasetelmia 9.1 Hierarkiset asetelmat (Nested Designs) Tietyissä koetilanteissa yhden faktorin tasot ovat samanlaisia joskaan ei täysin identtisiä toisen faktorin eri tasoilla. Tällaista asetelmaa

Lisätiedot

Harjoitukset 2 : Monimuuttujaregressio (Palautus )

Harjoitukset 2 : Monimuuttujaregressio (Palautus ) 31C99904, Capstone: Ekonometria ja data-analyysi TA : markku.siikanen(a)aalto.fi & tuuli.vanhapelto(a)aalto.fi Harjoitukset 2 : Monimuuttujaregressio (Palautus 24.1.2017) Tämän harjoituskerran tarkoitus

Lisätiedot

Oletetaan, että virhetermit eivät korreloi toistensa eikä faktorin f kanssa. Toisin sanoen

Oletetaan, että virhetermit eivät korreloi toistensa eikä faktorin f kanssa. Toisin sanoen Yhden faktorin malli: n kpl sijoituskohteita, joiden tuotot ovat r i, i =, 2,..., n. Olkoon f satunnaismuuttuja ja oletetaan, että tuotot voidaan selittää yhtälön r i = a i + b i f + e i avulla, missä

Lisätiedot

1. USEAN SELITTÄJÄN LINEAARINEN REGRESSIOMALLI JA OSITTAISKORRELAATIO

1. USEAN SELITTÄJÄN LINEAARINEN REGRESSIOMALLI JA OSITTAISKORRELAATIO Mat-2.104 Tilastollisen analyysin perusteet / Ratkaisut Aiheet: Avainsanat Usean selittäjän lineaarinen regressiomalli Estimaatti, Estimaattori, Estimointi, Jäännösneliösumma, Jäännöstermi, Jäännösvarianssi,

Lisätiedot

r = r f + r M r f (Todistus kirjassa sivulla 177 tai luennon 6 kalvoissa sivulla 6.) yhtälöön saadaan ns. CAPM:n hinnoittelun peruskaava Q P

r = r f + r M r f (Todistus kirjassa sivulla 177 tai luennon 6 kalvoissa sivulla 6.) yhtälöön saadaan ns. CAPM:n hinnoittelun peruskaava Q P Markkinaportfolio on koostuu kaikista markkinoilla olevista riskipitoisista sijoituskohteista siten, että sijoituskohteiden osuudet (so. painot) markkinaportfoliossa vastaavat kohteiden markkina-arvojen

Lisätiedot

xi = yi = 586 Korrelaatiokerroin r: SS xy = x i y i ( x i ) ( y i )/n = SS xx = x 2 i ( x i ) 2 /n =

xi = yi = 586 Korrelaatiokerroin r: SS xy = x i y i ( x i ) ( y i )/n = SS xx = x 2 i ( x i ) 2 /n = 1. Tutkitaan paperin ominaispainon X(kg/dm 3 ) ja puhkaisulujuuden Y (m 2 ) välistä korrelaatiota. Tiettyä laatua olevasta paperierästä on otettu satunnaisesti 10 arkkia ja määritetty jokaisesta arkista

Lisätiedot

MTTTP5, luento Luottamusväli, määritelmä

MTTTP5, luento Luottamusväli, määritelmä 23.11.2017/1 MTTTP5, luento 23.11.2017 Luottamusväli, määritelmä Olkoot A ja B satunnaisotoksen perusteella määriteltyjä satunnaismuuttujia. Väli (A, B) on parametrin 100(1 - ) %:n luottamusväli, jos P(A

Lisätiedot

Mat Tilastollisen analyysin perusteet, kevät 2007

Mat Tilastollisen analyysin perusteet, kevät 2007 Mat-2.2104 Tilastollisen analyysin erusteet, kevät 2007 10. luento: Regressiomallin (selittäjien) valinta Kai Virtanen 1 Regressiomallin selittäjien valinnasta Mallista uuttuu selittäjiä => harhaiset regressiokertoimien

Lisätiedot

Otoskeskiarvo on otossuure, jonka todennäköisyysjakauma tiedetään. Se on normaalijakauma, havainnollistaminen simuloiden

Otoskeskiarvo on otossuure, jonka todennäköisyysjakauma tiedetään. Se on normaalijakauma, havainnollistaminen simuloiden 1 KERTAUSTA JA TÄYDENNYSTÄ Luento 30.9.2014 Olkoon satunnaisotos X 1, X 2,, X n normaalijakaumasta N(µ, σ 2 ), tällöin ~ N(µ, σ 2 /n), kaava (6). Otoskeskiarvo on otossuure, jonka todennäköisyysjakauma

Lisätiedot