Pienalue-estimointi (78189) Kevät 2011 Risto Lehtonen

Koko: px
Aloita esitys sivulta:

Download "Pienalue-estimointi (78189) Kevät 2011 Risto Lehtonen"

Transkriptio

1 Helsingin yliopisto Sosiaalitieteien laitos 1 Pienalue-estimointi (78189) Kevät 2011 Risto Lehtonen OSA 1 Estimaattorin tyyppi Mallin valinta Asetelmaperusteinen estimointi Horvitz-Thompson (HT) Malliavusteinen estimointi Yleistetyt regressioestimaattorit Generalize Regression Estimator (GREG) Malliperusteinen estimointi Synteettiset estimaattorit (SYN) Esimerejä

2 ESTIMAATTORIN TYYPPI 2 Päätyypit 1. Asetelmaperusteiset estimaattorit Desig-base estimators a) Estimaattorit, joissa ei äytetä lisäinformaatiota HT-estimaattori Háje-estimaattori b) Malliavusteiset estimaattorit Moel assiste estimators Yleistetyt regressioestimaattorit Generalize regression (GREG) Mallialibrointiestimaattorit (MC) Moel calibration estimators c) Kalibrointiestimaattorit Moel-free calibration estimators 2. Malliperusteiset estimaattorit Moel base estimators a) Synteettiset (SYN) estimaattorit Synthetic estimators b) EBLUP-estimaattorit Empirical best linear unbiase preictor

3 Table 1. Malliavusteisten ja malliperusteisten estimaattoreien ominaisuusia (Lehtonen an Pahinen 2004) 3 Harha Bias Taruus Precision (Varianssi) Täsmällisyys Accuracy (MSE) Luottamusvälit Confience intervals Asetelmaperusteiset HT GREG Harhaton (ainain liimain) Varianssi voi olla suuri pienissä osajouoissa Varianssi pienenee osajouon otosoon asvaessa MSE = Variance (liimain) Asetelmaperusteiset luottamusvälit OK Malliperusteiset Syntettiset SYN EBLUP Harhainen Harha ei välttämättä lähene nollaa osajouon otosoon asvaessa Varianssi voi olla pieni myös pienissä osajouoissa Varianssi pienenee osajouon otosoon asvaessa MSE = Variance + square Bias Täsmällisyys voi olla huono jos harha on suuri Asetelmaperusteiset luottamusvälit ei välttämättä OK

4 Estimaattoreien teoreettisia ominaisuusia voiaan tutia empiirisesti simulointioeien avulla: 4 Harha Bias Bias( tˆ) E(ˆ t ) T Taruus Precision Var( tˆ) E(ˆ t E(ˆ)) t 2 Täsmällisyys Accuracy MSE(ˆ) t E(ˆ t T) 2 Var(ˆ) t Bias 2 (ˆ) t

5 MALLIN VALINTA 5 Kasi näöulmaa Mallin matemaattinen muoto Mallin parametrisointi ESIMERKKI: Matemaattinen muoto Jatuva tulosmuuttuja Lineaarinen malli Binäärinen tulosmuuttuja Binominen logistinen malli Moniluoainen tulosmuuttuja Multinomiaalinen logistinen malli Luumäärämuuttuja Poisson-regressiomalli HUOM: Mallit ovat yleistettyjen lineaaristen seamallien (Generalize Linear Mixe Moels GLMM) erioistapausia (McCulloch an Searle 2001)

6 6 Tilastolliset mallit matemaattisen muoon, tulosmuuttujan tyypin ja selittäjien tyypin muaan Epälineaariset mallit Lineaariset mallit Logistiset Logaritmiset (Poisson) -mallit Selittäjämuuttujat Tulosmuuttuja jatuva Tulosmuuttuja binäärinen tai moniluoainen Tulosmuuttuja luumäärämuuttuja Disreettejä Lineaarinen ANOVA Logit-ANOVA Logaritminen (Poisson) ANOVA Jatuvia Lineaarinen regressio Logit-regressio Logaritminen (Poisson) regressio Disreettejä ja jatuvia Lineaarinen ANCOVA Logit-ANCOVA Logaritminen (Poisson) ANCOVA

7 MALLIN PARAMETRISOINTI 7 Kasi perustyyppiä: Kiinteien teijöien malli Fixe-effects moel formulation Esimerisi: Lineaarinen malli y z Kiinteät teijät 0 ja 1 Seamalli / Hierarinen malli / Monitasomalli Mixe moel / Hierarchical moel / Multilevel moel formulation Esimerisi: Lineaarinen malli y u z Domain-ohtaiset satunnaistermit u 0 HUOM: Kutain mallia vastaava malliavusteinen (GREG; MC) ja malliperusteinen (SYN, EBLUP) estimaattori voiaan onstruoia

8 ESIMERKKI (Lehtonen, Särnal an Veijanen 2003) Table 3. Estimaattoreien luoittelu mallin valinnan ja estimaattorin tyypin muaan 8 Kiinteien teijöien mallit MALLIN VALINTA Aggregoinnin taso Population moels Mallin parametrisointi Matemaattinen muoto ESTIMAATTORIN TYYPPI 1. Lineaarinen SYN-P GREG-P 2. Logistinen LSYN-P LGREG-P Domain moels 3. Lineaarinen SYN-D GREG-D 4. Logistinen LSYN-D LGREG-D Seamallit Domain moels 5. Lineaarinen MSYN-D MGREG-D 6. Logistinen MLSYN-D Malliperusteinen Asetelmaperusteinen malliavusteinen MLGREG- D P-mallit (Perusjouon tasoinen): Kiinteien teijöien mallit, parametrisointi populaatiotasoisena D-mallit (Domain-tasoinen): Mallissa omain-ohtaisia parametreja (iinteitä tai satunnaisia)

9 TARKASTELUKEHIKKO JA PERUSTEITA 9 Notaatio Äärellinen perusjouo U 1,2,...,,..., N Toisensa poissulevat perusjouon osajouot (omains) U,..., U,..., U 1 Oletetaan ensin että aliotasoinen (unit-level) perusjouo U on äytettävissä ehioperusjouon muoossa Tilastoreisteri Väestöreisteri Yritysreisteri D Oletetaan että U sisältää joaiselle aliolle muuttujat: U Ientifiaatiomuuttuja (ID) Osajouoon uulumisiniaattorit Ositeiniaattorit Ryväsiniaattorit Apumuuttujatieot (z-muuttujat)

10 Tulosmuuttuja: y Y Tulosmuutujan (tuntematon) arvo aliolle 10 Koheparametrit: Osajouototaalit (Domain totals) Apumuuttujat: T Y, 1,..., D U z imensio J 1 ( z 1,..., z,..., z ) j J Domain-iniaattorivetori: δ ( 1,...,,..., ) D muulloin : Ositeiniaattorivetori: τ : = 1 un U, nolla τ h 1 un U h, h 1,..., H, nolla muulloin, missä U h viittaa ositteeseen h ja H on ositteien luumäärä.

11 HUOM: Vetori z oletetaan tunnetusi aiille alioille U 11 ESIMERKKI Henilötutimus: Vetori z sisältää muuttujat iä, suupuoli, verotustieot, oulutustieot, työllisyystieot ym. jatuvia ja isreettejä muuttujia henilölle Yritystutimus: Vetori z sisältää muuttujat liievaihto ja henilöstön luumäärä yrityselle Misi apumuuttujavetori z oletetaan tunnetusi? Joustavuusperiaate. Data voiaan tarvittaessa aggregoia osajouo- tai ositetasolle. Parhaat mallit saaaan aliotasoisina. HUOM: Ysinertaisimmissa tapausissa riittää että tunnetaan aggregaatteja, uten osajouojen totaalit T,..., apumuuttujille z j z T 1 z J Mallinnusvaiheessa tavallisesti oletetaan että vaio 1 on vetorin z ensimmäinen alio

12 Otanta ja tieoneruu 12 Satunnaisotos s ooa n poimitaan perusjouosta U äyttämällä otanta-asetelmaa p(s) jossa sisältymistoennäöisyys iinnitetään aliolle U Asetelmapaino: w 1/ Tulosmuuttujan arvot y mitataan otosalioilta s Vastausaon ajustointi Ysiöato (unit nonresponse): Uuelleenpainotus tarvittaessa Eräato (item nonresponse): Imputointi tarvittaessa

13 KAKSI VAIHTOEHTOISTA DOMAIN- RAKENNETTA 13 Osajouojen otoset: s U s, 1,..., D Ei-suunniteltu (unplanne) omain-raenne: Ósajouojen otosooja n s ei ole iinnitetty otanta-asetelmassa Otosoot n s ovat satunnaismuuttujia Suunniteltu (planne) omain-raenne: Osajouojen otosoot n on iinnitetty otanta-asetelmassa (ositettu otanta) Osajouojen otosoot n ovat iinteitä Ositettu otanta ja sopiva iintiöintimenetelmä Optimaalinen (Neyman) -iintiöinti Banier-iintiöinti Tasaiintiöinti

14 14 Table 4. Planne an unplanne omain structures in a stratifie sample of n elements, Lehtonen an Pahinen (2004) Unplanne omains 1 s11 2 s21... s 1... D s D 1 Strata (planne omains) 1 2 h H Sum n n s 12 ns 1 n h s 1 n H s 1 n n s 22 ns 2 n h s 2 n H s 2 n n s 2 n s n h s n H s n Sum 1 n 2 n s D 2 n s n Dh sdh n n h n H n n s D Stratum sample sizes n h, h = 1,,H, are fixe in the sampling esign. Thus, the strata are efine as planne omains. Sample sizes n, = 1,,D, for unplanne omains are not fixe s in avance an thus are ranom variables. Cell sample sizes n are ranom variables in both cases. s h

15 ESIMERKKI 15 Ei-suunniteltu raenne: Ootettu otosoo osajouossa, otanta-asetelmana SRSWOR: E( n ) n( N / N) s Suunniteltu raenne: Osajouot on määritelty ositteisi Oletetaan että tulosmuuttujan y variaatioertoimet C.Vy S y / Y tunnetaan aiissa osajouoissa, missä S y ja Y ovat perusjouon esihajonta ja esiarvo omainissa Banier-iintiöinti: Domain-otosoot ovat n, pow T C.V a z y n, D a 1 T C.V z y Vaio a = 0 tässä tapausessa.

16 Perusjouo: Occupational Health Care Survey (OHC), N 7841 henilöä 16 Parametrit: Domain-totaalit T Y, 1,..., D U Pitäaiaisesti sairaien luumäärä osajouoissa D 30 osajouoa Otos: SRSWOR, otosoo n 392 Horvitz-Thompson-estimaattori: tˆ HT w y, 1,..., D s missä w 1/ Laatuiniaattori: Estimaattorin variaatioerrtoin coefficient of variation C.V( t ˆ ) S.E(ˆ t ) / T HT HT

17 Table 5. HT-estimaattoreien CV (%) ei-suunnitellussa ja suunnitellussa omain-raenteessa (Lehtonen an Pahinen 2004). 17 Domain D N Domain-otosoo HT-estimaattoreien C.V (%) Eisuunniteltu raenne SRSWOR E ( n s ) Suunniteltu raenne Banieriintiöinti n Eisuunniteltu raenne SRSWOR C.V HT (ˆ t ) Suunniteltu raenne Banieriintiöinti C.V HT Sum (ˆ t )

18 HT (SRSWOR) HT (Power) Size of population omain Figure 1. (Lehtonen an Pahinen 2004) Horvitz-Thompson-estimaattorin variaatioerroin (%) SRSWOR-otannan tilanteessa (vastaa unplanne-raennetta) ja ositetun SRSWORotannan tilanteessa (Banier-iintiöinti, a = 0) (vastaa planne-raennetta).

19 BOX 1. Estimointiproseuurin operationaaliset vaiheet 19 Vaihe 1: Kehioperusjouon onstruointi. Muoostetaan N alion perusjouo U, joa sisältää seuraavat muuttujat: ID-tieto, omain-iniaattorit, ositeiniaattorit, sisältymistoennäöisyyet n alion otosta varten asetelmalla p(s), ja apumuuttujavetorit aiille alioille U. Vaihe2: Otanta ja mittaus. Poimitaan otos asetelmalla p(s) ja erätään tieot tulosmuuttujasta y. Muoostetaan otostieosto s(y), joa sisältää seuraavat muuttujat: ID-tieto, havaittu y-muuttujan arvo ja asetelmapainot aiille alioille s. Vaihe 3: Yhistetään U ja s(y). Muoostetaan yhistetty tieosto mirolinaamalla (merge) avaimen ID avulla ehiopj U ja otosaineisto s(y). Vaihe 4: Mallin valinta ja mallin sovitus. Mallin matemaattisen muoon valinta, parametrisointi ja sovittaminen otosaineistolle. Mallin iagnostiia. Lasetaan sovitetun mallin avulla tulosmuuttujan y sovitteet aiille pj:n alioille U seä resiuaalit aiille otosalioille s. Vaihe 5. Domain-estimaattoreien valinta ja estimointi. Käyttämällä sovitteita, resiuaaleja ja asetelmapainoja lasetaan estimaatit ullein osajouolle. Vaihe 6: Estimaattoreien laatuiniaattorit. Domainestimaattoreien varianssien, esivirheien ja variaatioertoimien estimointi. (Lehtonen an Pahinen 2004)

20 Table 6. Vaiheien 1, 3 ja 4 havainnollistaminen. 20 Vaihe 1: Kehioperusjouon U onstruointi Vaihe 3: Yhistetään U ja s(y) Vaihe 4: Lasetaan sovitteet ja resiuaalit Alio ID Domain δ Osite τ π Otos- Ini. I Apumuuttujat z Asetelmapainot w Tulosmuuttuja y Sovitteet ŷ Resiuaalit ê δ 1 τ π 1 1 z δ 2 τ π 2 2 z δ 3 τ 3 3 π 3 z w 1 3 δ 4 τ π 4 4 z δ 5 τ π 5 5 z 5 w 1 5 ŷ... 1 ŷ... 2 y 3 ŷ 3 ê 3 ŷ... 4 ê y 5 ŷ δ τ π z w 1 y ŷ ê N δ N τ N π N z N ŷ... N Non-sample element

21 HUOM: 21 Apumuuttujavetorit z ( 1,..., ) z zj oletetaan tunnetusi aiille pj:n alioille Tällöin apumuuttujien totaalien vetori T (,..., ) z Tz T 1 z missä T J z j U z j, j 1,..., J, on tunnettu Kosa omain-iniaattorit tunnetaan, voiaan lasea apumuuttujien omain-totaalit T z z j, 1,..., D ja j 1,..., J j U Mallin sovitusvaiheessa lasetaan sovitteet yˆ aiille N aliolle U Resiuaalit eˆ y yˆ voiaan lasea vain otoshavainnoille s Sovitteet yˆ, U vaihtelevat spesifioiusta mallista riippuen.

22 DOMAIN-TOTAALIEN ESTIMAATTORIT 22 Osajouototaalien päätyypit: T y estimaattoreien U Horvitz-Thompson estimaattori HT t ˆ w y y / HT s s Synteettinen estimaattori SYN tˆ SYN yˆ (1) U Yleistetty regressioestimaattori GREG (Generalize regression estimator) (2) t ˆ y ˆ w ( y y ˆ ) GREG U s Yhistelmäestimaattori (Composite estimator) missä t ˆ y ˆ ˆ a ( y y ˆ ) w COMP U s 1/, s s U ja 1,..., D COMP-estimaattorissa ˆ on omain-spesifi paino, 0 ˆ 1, jota tarvitaan erityisesti EBLUPestimaattorin yhteyessä

23 23 ESTIMAATTOREIDEN KONSTRUOINTI JA MALLIN SPESIFIOINTI Työvaiheet: (1) Estimoiaan valitun mallin parametrit äyttämällä otosaineistoa s( y) ( y, z ); s. (2) Mallin parametriestimaattien ja apumuuttujavetoreien z avulla lasetaan sovitteet yˆ aiille perusjouon alioille (otosaliot ja otosen ulopuoliset aliot) (3) Domain-totaalin T estimaattia tˆ varten omainissa sijoitetaan sovitteetyˆ ; U ja otoshavainnot y ; s vastaaviin estimaattoriaavoihin (GREG, SYN, COMP tai EBLUP).

24 ESIMERKKI 24 a) Kiinteien teijöien lineaarinen malli: y z β missä β on mallin tuntematon parametrivetori ja resiuaalit ovat Sovitetaan malli, saaaan estimaatti βˆ Lasetaan sovitteet yˆ = z βˆ aiille b) Lineaarinen seamalli: y z ( β u ) U missä u on omain-spesifien satunnaistermien vetori Estimoiaan mallin parametrit ja lasetaan sovitteet yˆ z (ˆ β uˆ ) aiille U

25 MALLIN SPESIFIOINTI 25 Oloon (J+1)-imensioinen apumuuttujavetori z = ( 1, z 1,..., z,..., z ), j 1,..., J j J Vetoria tarvitaan sovitteien yˆ, varten U lasentaa (1) Kiinteien teijöien P-mallit Estimaattorit SYN-P ja GREG-P perustuvat lineaariseen malliin y 0 1z1... J zj zβ (3) U, missä β (, 1,..., J ) on iinteien teijöien vetori joa on määritelty oo populaatiolle 0 Malli (3) on iinteien teijöien P-malli

26 Mallin parametrien estimointi 26 Perusjouon tasolla: Vetorin β PNS-estimaattori: 1 B z z z y (4) U U Käytettävissä otosaineisto: Painotettu PNS (Weighte least-squares, WLS) estimaattori parametrille (4) lasetaan äyttämällä otoshavaintoja: 1 bˆ w z w y z z (5) s s missä w 1/ on alion asetelmapaino Sovitteet ovat: yˆ zbˆ, U (6)

27 HUOM: Epäsuora omain-estimaattori 27 Kun äytetään P-mallia ositteelle, myös muien osajouojen y-arvot vaiuttavat osajouon totaaliestimaattoreihin SYN-P ja GREG-P sijoitettaviin sovitteisiin y ˆ Tästä syystä iinteien teijöien P-malliin perustuvia estimaattoreita tˆ SYN P ja tˆ GREGP utsutaan epäsuorisi (inirect)

28 28 (2) Kiinteien teijöien D-mallit. Estimaattorit SYN-D ja GREG-D perustuvat samaan apumuuttujavetoriin z, mutta malli määritellään omainohtaisesi: y z β (7) U, 1,..., D, tai y D 1 z β (8) U, missä on alion omain-iniaattori: = 1 un U, nolla muulloin, 1,..., D, ja β on omain-ohtainen parametrivetori Malli (7) on iinteien teijöien D-malli PNS-estimaattori parametrille : 1,...,D 1 U B z z z y (9) U

29 Otosataan perustuva WLS estimaaattori: 29 1,...,D Sovitteet ovat: 1 s bˆ w z z w z y (10) s yˆ zbˆ (11) ; 1,..., D U Sijoittamalla sovitteet yˆ aavoihin (1) ja (2) saaaan vastaavat estimaattorit SYN-D ja GREG- D HUOM: Suora omain-estimaattori D-mallien sovitusessa ussain omainissa äytetään vain yseisen omainin y-arvoja Vastaavia estimaattoreita tˆsyn D ja tˆgreg D utsutaan suorisi (irect)

30 HUOM: 30 Estimaattorin (9) täyellisempi muoto on GLSestimaattori (Generalize least squares) 1 U / c B z z z y / c U missä c on muotoa c λz aliolle U ja (J+1)-vetori λ ei riipu arvosta. Käytännössä asetetaan usein c 1 aiille Kosa nyt c λ z 1, seuraa siitä että GREGestimaattorin jäännöstotaalin HT-estimaatti w ( y ˆ y ) 0 s Tästä seuraa että SYN-D ja GREG-D ovat ienttiset, eli tˆ SYN D = tˆ GREG D joaiselle otoselle s, un äytetään iinteien teijöien D-mallia

31 (3) Seamallit. Estimaattorit MSYN-D ja MGREG-D perustuvat lineaariseen asitasomalliin (seamalliin), jota utsumme lineaarisesi D-tyypin seamallisi 31 Mallissa on iinteitä teijöitä ja omainohtaisia satunnaisia teijöitä: y u U 0 0, 1,..., D ( 1 u1 ) z1 = ( β u... ( J u J ) z J z ) (12) Kuin mallin termi voiaan ajatella populaatiotasoisen iinteän teijän ja omainohtaisen satunnaisteijän summasi: 0 u0 vaiotermille (intercept) u, j = 1,..., J ulmaertoimille (slopes) j j Termit u ( u, u1,..., uj ) eustavat poieamia mallin iinteän osan parametreista 0 y z... z z β (13) J J =

32 HUOM: 32 Käytännössä vai osa termeistä määritellään satunnaisisi, jolloin joillein j, u j 0 aiissa omaineissa Erioistapaus, jota äytetään paljon äytännön sovellusissa, on malli jossa on vain omainohtaiset satunnaiset vaiotermit u 0 : y ( u ) z... z J J Sovitteet lasetaan aavalla yˆ z (ˆ β uˆ ) (14) Saaaan estimaattorit MSYN-D ja MGREG-D (Lehtonen an Veijanen 1999) D-malli (12) voiaan sovittaa esimerisi estimoimalla varianssiomponentit suurimman usottavuuen (ML) tai rajoitetulla suurimman usottavuuen (restricte maximum lielihoo REML) menetelmällä ja iinteät teijät GLSmenetelmällä eholla varianssiomponentit (esim. Golstein 2003 tai McCulloch an Searle 2001).

33 Yleistettyjen lineaaristen seamallien GLMM ehiossa voiaan irjoittaa malli: 33 E ( y u ) g( z ( βu )) m Erioistapausia: Lineaarinen malli (jatuva tulosmuuttuja): E ( y u ) z ( βu ) m Multinomiaalinen logistinen seamalli (moniluoainen tulosmuuttuja): E ( y u ) m i m exp( z ( βi ui )) 1 exp( z ( β u )) r2 r r (Lehtonen, Särnal an Veijanen 2003)

34 ESIMERKKI 34 Jatuvatyyppinen y, jona totaali T estimoiaan omaineille U, 1,..., D Oletetaan ysi jatuvatyyppinen apumuuttuja z Avustavat mallit: (1) Kiinteien teijöien P-mallit y, U : (1a) y 0 (1b) y 1 z (1c) z y 0 1 (2) Kiinteien teijöien D-mallit y, U, 1,..., D: (2a) y 0 (2b) y z 1 (2c) y 0 1 z (3) Seamallit y, U, 1,..., D: (3a) y 0 0 u0 (3b) z u y z

35 HUOM: 35 Mallit (1b) ja (2b): Suhetehosteinen estimointi (Ratio estimation) osajouoille Mallit (1c) ja (2c): Regressioestimointi osajouoille HUOM: Mallit (1) ja (3): Epäsuorat (Inirect) estimaattorit SYN ja GREG Malli (2): Suorat (Direct) estimaattorit SYN ja GREG

36 ESIMERKKI 36 P-malli (1b) SYN-estimaattori (1) totaaleille T : 1,..., D tˆ yˆ bˆ z SYN P U U 1 T bˆ T tˆ / tˆ z 1 z HT zht (18) Parametrin (slope) B 1 estimaattori on: b ˆ1 s s w w y z tˆ tˆ HT zht Ono tämä estimaattori suora (irect) vai epäsuora (inirect)? Estimaattori (18) on epäsuora. Misi? Estimaattori tˆ SYN P osajouolle äyttää y- muuttujan arvoja oo otosesta ja pyrii siten lainaamaan voimaa (borrowing strength) myös muista omaineista

37 HUOM: 37 SYN-estimaattorin (18) harha Estimaattorin aavalla tˆ harhaa approsimoiaan SYN P BIAS(ˆ tsyn P) E(ˆ tsyn P) T Tz ( B 1 B1 ) missä B 1 U y / U z on omain-ohtainen parametri (slope), 1,..., D B 1 U y / U z on perusjouotasoinen parametri Domainille harha on pieni, jos perusjouotasoinen parametri B 1 approsimoi hyvin osajouoohtaista parametria B 1 Merittävä harha seuraa jos ehto ei ole voimassa.

38 Vastaava epäsuora GREG-estimaattori (2) omain-totaaleille T : 38 tˆ GREGP U yˆ s w ( y yˆ ) t ˆ z ) ˆSYN P w ( y b1 s tˆ ˆ HT t ( ˆ HT Tz tzht ) (19) tˆ zht HUOM: Yritys lainata voimaa pätee myös tälle estimaattorille

39 39 Suorat estimaattorit SYN ja GREG tyyppiä (2b) äyttävät y-arvoja vain yseisestä omainista Korvataan ˆb 1 aavassa (18) omain-ohtaisella estimaattorilla bˆ 1 : b ˆ1 s s w w y z tˆ tˆ HT zht, 1,..., D, missä tˆ HT ja tˆ zht ovat totaalien T ja T z omainohtaisia HT-estimaattoreita Suora estimaattori SYN tˆ SYN D ˆ yˆ b z Tz tˆ HT / tˆ zht tsyn D U 1 U ˆ, 1,...,D. (20) Tässä tapausessa suora GREG-estimaattori tˆ GREG D on ienttinen suoran SYN-estimaattorin anssa, osa GREG-estimaattorin harhanorjaustermi on tällöin nolla.

Pienalue-estimointi (78189) Kevät 2011 Risto Lehtonen

Pienalue-estimointi (78189) Kevät 2011 Risto Lehtonen Helsingin yliopisto Sosiaalitieteien laitos 1 Pienalue-estimointi (78189) Kevät 2011 Risto Lehtonen OSA 4 Laajennettu GREG-estimaattoreien perhe Avustavat mallit Yleistetty lineaarinen malli Lineaarinen

Lisätiedot

Pienalue-estimointi (78189) Kevät 2011 Risto Lehtonen

Pienalue-estimointi (78189) Kevät 2011 Risto Lehtonen Helsingin yliopisto Sosiaalitieteien laitos 1 Pienalue-estimointi (78189) Kevät 2011 Risto Lehtonen OSA 3 GREG-estimaattori Yleinen tilanne (unequal probability sampling) Komposiittiestimaattorit (Composite

Lisätiedot

Otantamenetelmät. Syksy

Otantamenetelmät. Syksy Otantamenetelmät (78143) Sysy 2009 TEEMA 2 risto.lehtonen@helsini.fi Teema 2 LISÄTIEDON KÄYTTÖ ESTIMOINTIASETELMASSA: MALLIAVUSTEINEN ESTIMOINTI 2 Lisätiedon äyttö estimointiasetelmassa i t Malliavusteiset

Lisätiedot

Otantamenetelmät (78143) Syksy 2008 OSA 2: Malliavusteinen estimointi. Risto Lehtonen

Otantamenetelmät (78143) Syksy 2008 OSA 2: Malliavusteinen estimointi. Risto Lehtonen Otantamenetelmät (78143) Sysy 2008 OSA 2: Malliavusteinen estimointi Risto Lehtonen risto.lehtonen@helsini.fi Lisätiedon äyttö estimointiasetelmassa Tavoitteena estimoinnin tehostaminen poimitulle otoselle

Lisätiedot

Otanta-aineistojen analyysi (78136, 78405) Kevät 2010 TEEMA 4: Asetelmaperusteinen monimuuttuja-analyysi

Otanta-aineistojen analyysi (78136, 78405) Kevät 2010 TEEMA 4: Asetelmaperusteinen monimuuttuja-analyysi Otanta-aineistojen analyysi (78136, 78405) Kevät 2010 TEEMA 4: Asetelmaperusteinen monimuuttuja-analyysi Risto Lehtonen risto.lehtonen@helsini.fi Analyysimenetelmiä ja työaluja Lineaariset mallit Regressioanalyysi

Lisätiedot

Pienalue-estimointi (78189) Kevät 2011. Risto Lehtonen Helsingin yliopisto

Pienalue-estimointi (78189) Kevät 2011. Risto Lehtonen Helsingin yliopisto Pienalue-estimointi (78189) Kevät 2011 Risto Lehtonen Helsingin yliopisto Pienalue-estimointi Kurssin kotisivu http://wiki.helsinki.fi/pages/viewpage.action?pagei=62430039 2 Hyöyllisiä taustatietoja Otantamenetelmät

Lisätiedot

LISÄTIEDON KÄYTTÖ ESTIMOINTIASETELMASSA: MALLIAVUSTEINEN ESTIMOINTI

LISÄTIEDON KÄYTTÖ ESTIMOINTIASETELMASSA: MALLIAVUSTEINEN ESTIMOINTI Otatameetelmät (78143 Sysy 2010 TEEMA 2 risto.lehtoe@helsii.fi Teema 2 LISÄTIEDON KÄYTTÖ ESTIMOINTIASETELMASSA: MALLIAVUSTEINEN ESTIMOINTI 2 1 Lisätiedo äyttö estimoitiasetelmassa Malliavusteiset strategiat

Lisätiedot

(78143) Syksy 2009 TEEMAT 3 & 4. Risto Lehtonen Teema 3 ERITYISKYSYMYKSIÄ. Risto Lehtonen 2

(78143) Syksy 2009 TEEMAT 3 & 4. Risto Lehtonen Teema 3 ERITYISKYSYMYKSIÄ. Risto Lehtonen 2 Otantamenetelmät (78143) Syksy 2009 TEEMAT 3 & 4 Risto Lehtonen risto.lehtonen@helsinki.fi Teema 3 ERITYISKYSYMYKSIÄ Risto Lehtonen 2 1 Otannan erityiskysymyksiä Ryväsotanta Survey sampling reference guidelines

Lisätiedot

Otanta-aineistojen analyysi

Otanta-aineistojen analyysi Helsingin yliopisto Otanta-aineistojen analyysi Kevät 2010 Periodi III Risto Lehtonen Teema 2 Estimaattoreiden varianssien estimointi Survey-analyysin lähestymistavat Kuvaileva survey Descriptive survey

Lisätiedot

, sanotaan niiden sääntöjen ja menetelmien kokonaisuutta, joilla otos poimitaan määritellystä perusjoukosta.

, sanotaan niiden sääntöjen ja menetelmien kokonaisuutta, joilla otos poimitaan määritellystä perusjoukosta. Y - Otatameetelmät / Sysy 009 (Risto Letoe) TEKIE YTEEVETO I Otata-asetelmat ja estimoitiasetelmat Perusjouo ja muuttujat Äärellie perusjouo U = {,...,,..., } Tulosmuuttuja y tutemattomat arvot Y,,Y,,Y

Lisätiedot

1. YKSISUUNTAINEN VARIANSSIANALYYSI: AINEISTON ESITYSMUODOT

1. YKSISUUNTAINEN VARIANSSIANALYYSI: AINEISTON ESITYSMUODOT imat-2.104 Tilastollisen analyysin perusteet / Tehtävät Aiheet: Avainsanat: Ysisuuntainen varianssianalyysi Bartlettin testi, Bonferronin menetelmä, F-testi, Jäännösneliösumma, χ 2 -testi, Koonaisesiarvo,

Lisätiedot

Kulutustutkimuksen alue-estimointi Pienalue-estimointimenetelmien vertailu Kulutustutkimus aineistossa

Kulutustutkimuksen alue-estimointi Pienalue-estimointimenetelmien vertailu Kulutustutkimus aineistossa Kulutustutkimuksen alue-estimointi Pienalue-estimointimenetelmien vertailu Kulutustutkimus 2006 -aineistossa Pauliina Maria Peltonen Helsingin yliopisto Matemaattis-luonnontieteellinen tiedekunta Tilastotiede

Lisätiedot

Uudelleenpainotus ja imputointi Perusteita

Uudelleenpainotus ja imputointi Perusteita Heisigi yliopisto Matematiia ja tilastotietee laitos Otatameetelmät Sysy 008 Uudelleepaiotus ja imputoiti Perusteita Prof. Risto Lehtoe, Helsigi yliopisto.1.008 Uudelleepaiotus Otostasoise tiedo äyttö

Lisätiedot

Olkoot X ja Y riippumattomia satunnaismuuttujia, joiden odotusarvot, varianssit ja kovarianssi ovat

Olkoot X ja Y riippumattomia satunnaismuuttujia, joiden odotusarvot, varianssit ja kovarianssi ovat Mat-.3 Koesuunnittelu ja tilastolliset mallit. harjoituset Mat-.3 Koesuunnittelu ja tilastolliset mallit. harjoituset / Rataisut Aiheet: Avainsanat: Satunnaismuuttujat ja todennäöisyysjaaumat Kertymäfuntio

Lisätiedot

Harha mallin arvioinnissa

Harha mallin arvioinnissa Esitelmä 12 Antti Toppila sivu 1/18 Optimointiopin seminaari Syksy 2010 Harha mallin arvioinnissa Antti Toppila 13.10.2010 Esitelmä 12 Antti Toppila sivu 2/18 Optimointiopin seminaari Syksy 2010 Sisältö

Lisätiedot

Todennäköisyysjakaumat 1/5 Sisältö ESITIEDOT: todennäköisyyslaskenta, määrätty integraali

Todennäköisyysjakaumat 1/5 Sisältö ESITIEDOT: todennäköisyyslaskenta, määrätty integraali Todennäöissjaaumat /5 Sisältö ESITIEDOT: lasenta, määrätt Haemisto KATSO MYÖS: tilastomatematiia P (X = )=p. Nämä ovat 0 ja niiden summa on p =. Pistetodennäöisdet voidaan graafisesti esittää pstsuorien

Lisätiedot

2 Taylor-polynomit ja -sarjat

2 Taylor-polynomit ja -sarjat 2 Taylor-polynomit ja -sarjat 2. Taylor-polynomi Taylor-polynomi P n (x; x 0 ) funtion paras n-asteinen polynomiapprosimaatio (derivoinnin annalta) pisteen x 0 lähellä. Maclaurin-polynomi: tapaus x 0 0.

Lisätiedot

MS-A0402 Diskreetin matematiikan perusteet

MS-A0402 Diskreetin matematiikan perusteet MS-A0402 Disreetin matematiian perusteet Osa 3: Kombinatoriia Riia Kangaslampi 2017 Matematiian ja systeemianalyysin laitos Aalto-yliopisto Kombinatoriia Summaperiaate Esimeri 1 Opetusohjelmaomiteaan valitaan

Lisätiedot

Otanta-aineistojen analyysi (78136, 78405) Kevät 2010 TEEMA 3: Frekvenssiaineistojen asetelmaperusteinen analyysi: Perusteita

Otanta-aineistojen analyysi (78136, 78405) Kevät 2010 TEEMA 3: Frekvenssiaineistojen asetelmaperusteinen analyysi: Perusteita Otanta-aineistojen analyysi (78136, 78405) Kevät 2010 TEEMA 3: Frekvenssiaineistojen asetelmaperusteinen analyysi: Perusteita risto.lehtonen@helsinki.fi OHC Survey Tilastollinen analyysi Kysymys: Millä

Lisätiedot

PIENALUE-ESTIMOINTIMENETELMÄT:

PIENALUE-ESTIMOINTIMENETELMÄT: Pro gradu -tutkielma Tilastotiede PIENALUE-ESTIMOINTIMENETELMÄT: SOVELLUSKOHTEENA SUOMALAISTEN KOETTU TOIMEENTULO VUONNA 2009 Nico Maunula Toukokuu 2012 Ohjaaja: Risto Lehtonen HELSINGIN YLIOPISTO Matematiikan

Lisätiedot

ABHELSINKI UNIVERSITY OF TECHNOLOGY

ABHELSINKI UNIVERSITY OF TECHNOLOGY Johdatus regressioanalyysiin Regressioanalyysin idea Oletetaan, että haluamme selittää jonkin selitettävän muuttujan havaittujen arvojen vaihtelun selittävien muuttujien havaittujen arvojen vaihtelun avulla.

Lisätiedot

[ ] [ 2 [ ] [ ] ( ) [ ] Tehtävä 1. ( ) ( ) ( ) ( ) ( ) ( ) 2( ) = 1. E v k 1( ) R E[ v k v k ] E e k e k e k e k. e k e k e k e k.

[ ] [ 2 [ ] [ ] ( ) [ ] Tehtävä 1. ( ) ( ) ( ) ( ) ( ) ( ) 2( ) = 1. E v k 1( ) R E[ v k v k ] E e k e k e k e k. e k e k e k e k. ehtävä. x( + ) x( y x( + e ( y x( + e ( E v E e ( ) e ( R E[ v v ] E e e e e e e e e 6 estimointivirhe: ~ x( x( x$( x( - b y ( - b y ( estimointivirheen odotusarvo: x( - b x( - b e ( - b x( - b e ( ( -

Lisätiedot

Otanta-aineistojen analyysi Kevät 2010 TEEMA 5: Tilastollinen mallinnus II Mallit, analyysimenetelmiä ja ohjelmia, PISA-esimerkki

Otanta-aineistojen analyysi Kevät 2010 TEEMA 5: Tilastollinen mallinnus II Mallit, analyysimenetelmiä ja ohjelmia, PISA-esimerkki Otanta-aineistojen analyysi Kevät 2010 TEEMA 5: Tilastollinen mallinnus II Mallit, analyysimenetelmiä ja ohjelmia, PISA-esimerkki risto.lehtonen@helsinki.fi Korreloituneiden havaintojen analyysi Lineaariset

Lisätiedot

Estimointi Laajennettu Kalman-suodin. AS , Automaation signaalinkäsittelymenetelmät Laskuharjoitus 4

Estimointi Laajennettu Kalman-suodin. AS , Automaation signaalinkäsittelymenetelmät Laskuharjoitus 4 Estimointi Laajennettu Kalman-suodin AS-84.2161, Automaation signaalinäsittelymenetelmät Lasuharjoitus 4 Estimointi Systeemin tilaa estimoidaan, un prosessin tilamalli tunnetaan Tilamalli voi olla lineaarinen

Lisätiedot

z z 0 (m 1)! g(m 1) (z0) k=0 Siksi kun funktioon f(z) sovelletaan Cauchyn integraalilausetta, on voimassa: sin(z 2 dz = (z i) n+1 k=0

z z 0 (m 1)! g(m 1) (z0) k=0 Siksi kun funktioon f(z) sovelletaan Cauchyn integraalilausetta, on voimassa: sin(z 2 dz = (z i) n+1 k=0 TKK, Matematiian laitos v.pfaler/pursiainen Mat-.33 Matematiian perusurssi KP3-i sysy 2007 Lasuharjoitus 4 viio 40 Tehtäväsarja A viittaa aluviion ja L loppuviion tehtäviin. Valmistauu esittämään nämä

Lisätiedot

Johdatus regressioanalyysiin. Heliövaara 1

Johdatus regressioanalyysiin. Heliövaara 1 Johdatus regressioanalyysiin Heliövaara 1 Regressioanalyysin idea Oletetaan, että haluamme selittää jonkin selitettävän muuttujan havaittujen arvojen vaihtelun selittävien muuttujien havaittujen arvojen

Lisätiedot

V. POTENSSISARJAT. V.1. Abelin lause ja potenssisarjan suppenemisväli. a k (x x 0 ) k M

V. POTENSSISARJAT. V.1. Abelin lause ja potenssisarjan suppenemisväli. a k (x x 0 ) k M V. POTENSSISARJAT Funtioterminen sarja V.. Abelin lause ja potenssisarjan suppenemisväli P a x x, missä a, a, a 2,... R ja x R ovat vaioita, on potenssisarja, jona ertoimet ovat luvut a, a,... ja ehitysesus

Lisätiedot

Tehtävä 2 Todista luennoilla annettu kaava: jos lukujen n ja m alkulukuesitykset. ja m = k=1

Tehtävä 2 Todista luennoilla annettu kaava: jos lukujen n ja m alkulukuesitykset. ja m = k=1 Luuteoria Harjoitus 1 evät 2011 Alesis Kosi 1 Tehtävä 1 Näytä: jos a ja b ovat positiivisia oonaisluuja joille (a, b) = 1 ja a c, seä lisäsi b c, niin silloin ab c. Vastaus Kosa a c, niin jaollisuuden

Lisätiedot

Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi

Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi TKK (c) Ilkka Mellin (2006) 1 Estimointi >> Todennäköisyysjakaumien parametrit ja niiden estimointi Hyvän estimaattorin

Lisätiedot

JOHDATUS LUKUTEORIAAN (syksy 2017) HARJOITUS 1, MALLIRATKAISUT

JOHDATUS LUKUTEORIAAN (syksy 2017) HARJOITUS 1, MALLIRATKAISUT JOHDATUS LUKUTEORIAAN (sysy 2017) HARJOITUS 1, MALLIRATKAISUT Tehtävä 1. (i) Etsi luvun 111312 aii teijät. (ii) Oloot a ja b positiivisia oonaisluuja joilla a b ja b a. Osoita, että silloin a = b. Rataisu

Lisätiedot

Regressioanalyysi. Kuusinen/Heliövaara 1

Regressioanalyysi. Kuusinen/Heliövaara 1 Regressioanalyysi Kuusinen/Heliövaara 1 Regressioanalyysin idea ja tavoitteet Regressioanalyysin idea: Oletetaan, että haluamme selittää jonkin selitettävän muuttujan havaittujen arvojen vaihtelun joidenkin

Lisätiedot

J1 (II.6.9) J2 (X.5.5) MATRIISILASKENTA(TFM) MALLIT AV 6

J1 (II.6.9) J2 (X.5.5) MATRIISILASKENTA(TFM) MALLIT AV 6 MATRIISILASKENTA(TFM) MALLIT AV 6 J (II.6.9) Päättele, että avaruusvetorit a, b ja c ovat lineaarisesti riippuvat täsmälleen un vetoreiden virittämän suuntaissärmiön tilavuus =. Tuti tällä riteerillä ovato

Lisätiedot

Regressioanalyysi. Vilkkumaa / Kuusinen 1

Regressioanalyysi. Vilkkumaa / Kuusinen 1 Regressioanalyysi Vilkkumaa / Kuusinen 1 Regressioanalyysin idea ja tavoitteet Regressioanalyysin idea: Halutaan selittää selitettävän muuttujan havaittujen arvojen vaihtelua selittävien muuttujien havaittujen

Lisätiedot

Tilastollisten menetelmien käyttö Kelan tutkimustoiminnassa

Tilastollisten menetelmien käyttö Kelan tutkimustoiminnassa Tilastollisten menetelmien käyttö Kelan tutkimustoiminnassa Risto Lehtonen Helsingin yliopisto Kela 1 Tilastokeskuksen SAS-seminaari 16.11.2009 Aiheita Kelan tutkimustoiminta SAS-sovellukset vaativien

Lisätiedot

Osa 2: Otokset, otosjakaumat ja estimointi

Osa 2: Otokset, otosjakaumat ja estimointi Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi TKK (c) Ilkka Mellin (2007) 1 Estimointi >> Todennäköisyysjakaumien parametrit ja niiden estimointi Hyvän estimaattorin

Lisätiedot

Erityiskysymyksiä yleisen lineaarisen mallin soveltamisessa

Erityiskysymyksiä yleisen lineaarisen mallin soveltamisessa Ilkka Mellin Tilastolliset menetelmät Osa 4: Lineaarinen regressioanalyysi Erityiskysymyksiä yleisen lineaarisen mallin soveltamisessa TKK (c) Ilkka Mellin (2007) 1 Erityiskysymyksiä yleisen lineaarisen

Lisätiedot

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme? TKK (c) Ilkka Mellin (2004) 1 Johdatus tilastotieteeseen TKK (c) Ilkka Mellin (2004) 2 Mitä opimme? 1/4 Tilastollisen tutkimuksen tavoitteena on tehdä johtopäätöksiä prosesseista, jotka generoivat reaalimaailman

Lisätiedot

Oletetaan, että virhetermit eivät korreloi toistensa eikä faktorin f kanssa. Toisin sanoen

Oletetaan, että virhetermit eivät korreloi toistensa eikä faktorin f kanssa. Toisin sanoen Yhden faktorin malli: n kpl sijoituskohteita, joiden tuotot ovat r i, i =, 2,..., n. Olkoon f satunnaismuuttuja ja oletetaan, että tuotot voidaan selittää yhtälön r i = a i + b i f + e i avulla, missä

Lisätiedot

Vakuutusmatematiikan sovellukset 20.11.2008 klo 9-15

Vakuutusmatematiikan sovellukset 20.11.2008 klo 9-15 SHV-tutinto Vauutusmatematiian sovelluset 20.11.2008 lo 9-15 1(7) Y1. Seuraava tauluo ertoo vauutusyhtiön masamat orvauset vahinovuoden ja orvausen masuvuoden muaan ryhmiteltynä (tuhansina euroina): Vahinovuosi

Lisätiedot

MS-A0402 Diskreetin matematiikan perusteet Esimerkkejä ym., osa I

MS-A0402 Diskreetin matematiikan perusteet Esimerkkejä ym., osa I MS-A00 Disreetin matematiian perusteet Esimerejä ym., osa I G. Gripenberg Jouo-oppi ja logiia Todistuset logiiassa Indutioperiaate Relaatiot ja funtiot Funtiot Aalto-yliopisto. maalisuuta 0 Kombinatoriia

Lisätiedot

805306A Johdatus monimuuttujamenetelmiin, 5 op

805306A Johdatus monimuuttujamenetelmiin, 5 op monimuuttujamenetelmiin, 5 op syksy 2018 Matemaattisten tieteiden laitos Logistinen regressioanalyysi Vastemuuttuja Y on luokiteltu muuttuja Pyritään mallittamaan havaintoyksikön todennäköisyyttä kuulua

Lisätiedot

Todennäköisyyslaskenta IIa, syys lokakuu 2019 / Hytönen 1. laskuharjoitus, ratkaisuehdotukset

Todennäköisyyslaskenta IIa, syys lokakuu 2019 / Hytönen 1. laskuharjoitus, ratkaisuehdotukset Todennäöisyyslasenta IIa, syys loauu 019 / Hytönen 1. lasuharjoitus, rataisuehdotuset 1. ( Klassio ) Oloot A ja B tapahtumia. Todista lasuaavat (a) P(A B) P(A) + P(B \ A), (b) P(B) P(A B) + P(B \ A), (c)

Lisätiedot

Differentiaali- ja integraalilaskenta 1 Ratkaisut 1. viikolle /

Differentiaali- ja integraalilaskenta 1 Ratkaisut 1. viikolle / MS-A8 Differentiaali- ja integraalilasenta, V/27 Differentiaali- ja integraalilasenta Rataisut. viiolle /. 3.4. Luujonot Tehtävä : Mitä ovat luujonon viisi ensimmäistä termiä, un luujono on a) (a n ) n=,

Lisätiedot

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1 Johdatus tilastotieteeseen Estimointi TKK (c) Ilkka Mellin (2005) 1 Estimointi Todennäköisyysjakaumien parametrit ja niiden estimointi Hyvän estimaattorin ominaisuudet TKK (c) Ilkka Mellin (2005) 2 Estimointi:

Lisätiedot

STOKASTISET DIFFERENTIAALIYHTÄLÖT 7

STOKASTISET DIFFERENTIAALIYHTÄLÖT 7 STOKASTISET DIFFERENTIAALIYHTÄLÖT 7 1. Todennäöisyyslasennasta ja merinnöistä Palautamme seuraavassa lyhyesti mieleen todennäöisyyslasennan äsitteitä ja esittelemme myös muutamia urssilla äytettäviä merintätapoja.

Lisätiedot

Estimointi populaation tuntemattoman parametrin arviointia otossuureen avulla Otossuure satunnaisotoksen avulla määritelty funktio

Estimointi populaation tuntemattoman parametrin arviointia otossuureen avulla Otossuure satunnaisotoksen avulla määritelty funktio 17.11.2015/1 MTTTP5, luento 17.11.2015 Luku 5 Parametrien estimointi 5.1 Piste-estimointi Estimointi populaation tuntemattoman parametrin arviointia otossuureen avulla Otossuure satunnaisotoksen avulla

Lisätiedot

K-KS vakuutussumma on kiinteä euromäärä

K-KS vakuutussumma on kiinteä euromäärä Kesinäinen Henivauutusyhtiö IIIELLA TEKNIIKALLA LAKUPERUTE H-TUTKINTOA ARTEN HENKIAKUUTU REKURIIIELLA TEKNIIKALLA OIMAAOLO 2 AIKALAKU JA AKUUTUIKÄ Tätä lasuperustetta sovelletaan..25 alaen myönnettäviin

Lisätiedot

Mat Tilastollisen analyysin perusteet, kevät 2007

Mat Tilastollisen analyysin perusteet, kevät 2007 Mat-.104 Tilastollisen analyysin perusteet, kevät 007 8. luento: Usean selittäjän lineaarinen regressiomalli Kai Virtanen 1 Usean selittäjän lineaarinen regressiomalli Selitettävän muuttujan havaittujen

Lisätiedot

DEE Lineaariset järjestelmät Harjoitus 5, harjoitustenpitäjille tarkoitetut ratkaisuehdotukset

DEE Lineaariset järjestelmät Harjoitus 5, harjoitustenpitäjille tarkoitetut ratkaisuehdotukset DEE- Lineaariset järjestelmät Harjoitus 5, harjoitustenpitäjille taroitetut rataisuehdotuset Tämän harjoitusen ideana on opetella -muunnosen äyttöä differenssiyhtälöiden rataisemisessa Lisäsi äytetään

Lisätiedot

JY / METODIFESTIVAALI 2013 PRE-KURSSI: KYSELYTUTKIMUS DEMOT

JY / METODIFESTIVAALI 2013 PRE-KURSSI: KYSELYTUTKIMUS DEMOT JY / METODIFESTIVAALI 2013 PRE-KURSSI: KYSELYTUTKIMUS DEMOT SPSS-ohjelmiston Complex Samples- toiminto otoksen poiminnassa ja estimaattien laskennassa Mauno Keto, lehtori Mikkelin AMK / Liiketalouden laitos

Lisätiedot

Tilastollisen analyysin perusteet Luento 9: Moniulotteinen lineaarinen. regressio

Tilastollisen analyysin perusteet Luento 9: Moniulotteinen lineaarinen. regressio Tilastollisen analyysin perusteet Luento 9: lineaarinen lineaarinen Sisältö lineaarinen lineaarinen lineaarinen Lineaarinen Oletetaan, että meillä on n kappaletta (x 1, y 1 ), (x 2, y 2 )..., (x n, y n

Lisätiedot

1. Tutkitaan regressiomallia Y i = β 0 + β 1 X i + u i ja oletetaan, että tavanomaiset

1. Tutkitaan regressiomallia Y i = β 0 + β 1 X i + u i ja oletetaan, että tavanomaiset TA7, Ekonometrian johdantokurssi HARJOITUS 7 RATKAISUEHDOTUKSET 16.3.2015 1. Tutkitaan regressiomallia Y i = β 0 + X i + u i ja oletetaan, että tavanomaiset regressiomallin oletukset pätevät (Key Concept

Lisätiedot

M 2 M = sup E M 2 t. E X t = lim. niin martingaalikonvergenssilauseen oletukset ovat voimassa, eli löydämme satunnaismuuttujan M, joka toteuttaa ehdon

M 2 M = sup E M 2 t. E X t = lim. niin martingaalikonvergenssilauseen oletukset ovat voimassa, eli löydämme satunnaismuuttujan M, joka toteuttaa ehdon Matematiian ja tilastotieteen laitos Stoastiset differentiaaliyhtälöt Rataisuehdotelma Harjoituseen 7 1. Näytä, että uvaus M M M 2, un M 2 M = sup E M 2 t 2 t 0 on normi jouossa M 2 = { M : M on martingaali

Lisätiedot

III. SARJATEORIAN ALKEITA. III.1. Sarjan suppeneminen. x k = x 1 + x 2 + x ,

III. SARJATEORIAN ALKEITA. III.1. Sarjan suppeneminen. x k = x 1 + x 2 + x , III. SARJATEORIAN ALKEITA Sarja on formaali summa III.. Sarjan suppeneminen = x + x 2 + x 3 +..., missä R aiilla N (merintä ei välttämättä taroita mitään reaaliluua). Luvut x, x 2,... ovat sarjan yhteenlasettavat

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 30. lokakuuta 2007 Antti Rasila () TodB 30. lokakuuta 2007 1 / 23 1 Otos ja otosjakaumat (jatkoa) Frekvenssi ja suhteellinen frekvenssi Frekvenssien odotusarvo

Lisätiedot

Pyramidi 3 Analyyttinen geometria tehtävien ratkaisut sivu 139 Päivitetty a) 402 Suplementtikulmille on voimassa

Pyramidi 3 Analyyttinen geometria tehtävien ratkaisut sivu 139 Päivitetty a) 402 Suplementtikulmille on voimassa Pyramidi Analyyttinen geometria tehtävien rataisut sivu 9 Päivitetty 9..6 4 a) 4 Suplementtiulmille on voimassa b) a) α + β 8 α + β 8 β 6 c) b) c) α 6 6 + β 8 β 8 6 β 45 β 6 9 α 9 9 + β 8 β 8 + 9 β 7 Pyramidi

Lisätiedot

Otanta-aineistojen analyysi

Otanta-aineistojen analyysi Helsingin yliopisto Otanta-aineistojen analyysi Kevät 2010 Periodi III Risto Lehtonen Teema 4 Asetelmaperusteinen monimuuttujaanalyysi Logistinen ANOVA ja GWLS-estimointi Binäärinen tulosmuuttuja Diskreetit

Lisätiedot

MS-A0204 Differentiaali- ja integraalilaskenta 2 (ELEC2) Luento 7: Pienimmän neliösumman menetelmä ja Newtonin menetelmä.

MS-A0204 Differentiaali- ja integraalilaskenta 2 (ELEC2) Luento 7: Pienimmän neliösumman menetelmä ja Newtonin menetelmä. MS-A0204 Differentiaali- ja integraalilaskenta 2 (ELEC2) Luento 7: Pienimmän neliösumman menetelmä ja Newtonin menetelmä. Antti Rasila Matematiikan ja systeemianalyysin laitos Aalto-yliopisto Kevät 2016

Lisätiedot

Hierarkkisen aineiston mallintaminen ja otanta/pre-kurssi

Hierarkkisen aineiston mallintaminen ja otanta/pre-kurssi Hierarkkisen aineiston mallintaminen ja otanta/pre-kurssi Risto Lehtonen, Helsingin yliopisto Metodifestivaali Jyväskylän yliopisto 27.5.2009 Keskiviikko 27.5 10-12 Hierarkkisuus otanta- asetelmaperusteisessa

Lisätiedot

edellyttää valintaa takaisinpanolla Aritmeettinen keskiarvo Jos, ½ Ò muodostavat satunnaisotoksen :n jakaumasta niin Otosvarianssi Ë ¾

edellyttää valintaa takaisinpanolla Aritmeettinen keskiarvo Jos, ½ Ò muodostavat satunnaisotoksen :n jakaumasta niin Otosvarianssi Ë ¾ ËØÙ ÓØÓ Ø Mitta-asteikot Nominaali- eli laatueroasteikko Ordinaali- eli järjestysasteikko Intervalli- eli välimatka-asteikko ( nolla mielivaltainen ) Suhdeasteikko ( nolla ei ole mielivaltainen ) Otos

Lisätiedot

VÄRÄHTELYMEKANIIKKA SESSIO 19: Usean vapausasteen systeemin liikeyhtälöiden johto Newtonin lakia käyttäen

VÄRÄHTELYMEKANIIKKA SESSIO 19: Usean vapausasteen systeemin liikeyhtälöiden johto Newtonin lakia käyttäen 9/ VÄRÄHTELYMEKANIIKKA SESSIO 9: Usean vapausasteen systeemin liieyhtälöiden johto Newtonin laia äyttäen JOHDANTO Usean vapausasteen systeemillä taroitetaan meaanista systeemiä, jona liietilan uvaamiseen

Lisätiedot

Mat Tilastollisen analyysin perusteet, kevät 2007

Mat Tilastollisen analyysin perusteet, kevät 2007 Mat-.14 Tilastollisen analyysin perusteet, kevät 7 7. luento: Tarina yhden selittään lineaarisesta regressiomallista atkuu Kai Virtanen 1 Luennolla 6 opittua Kuvataan havainnot (y, x ) yhden selittään

Lisätiedot

9 Lukumäärien laskemisesta

9 Lukumäärien laskemisesta 9 Luumäärie lasemisesta 9 Biomiertoimet ja osajouoje luumäärä Määritelmä 9 Oletetaa, että, N Biomierroi ilmaisee, uia mota -alioista osajouoa o sellaisella jouolla, jossa o aliota Meritä luetaa yli Lasimesta

Lisätiedot

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 4A Parametrien estimointi Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2016, periodi

Lisätiedot

805306A Johdatus monimuuttujamenetelmiin, 5 op

805306A Johdatus monimuuttujamenetelmiin, 5 op monimuuttujamenetelmiin, 5 op syksy 2018 Matemaattisten tieteiden laitos Lineaarinen erotteluanalyysi (LDA, Linear discriminant analysis) Erotteluanalyysin avulla pyritään muodostamaan selittävistä muuttujista

Lisätiedot

HARMONINEN VÄRÄHTELIJÄ

HARMONINEN VÄRÄHTELIJÄ Oulun yliopisto Fysiian opetuslaboratorio Fysiian laboratoriotyöt 1 1 HARMONINEN VÄRÄHELIJÄ 1. yön tavoitteet 1.1 Mittausten taroitus ässä työssä tutustut jasolliseen, määrätyin aiavälein toistuvaan liieeseen,

Lisätiedot

MTTTP5, luento Otossuureita ja niiden jakaumia (jatkuu)

MTTTP5, luento Otossuureita ja niiden jakaumia (jatkuu) 21.11.2017/1 MTTTP5, luento 21.11.2017 Otossuureita ja niiden jakaumia (jatkuu) 4) Olkoot X 1, X 2,..., X n satunnaisotos (, ):sta ja Y 1, Y 2,..., Y m satunnaisotos (, ):sta sekä otokset riippumattomia.

Lisätiedot

3. Markovin prosessit ja vahva Markovin ominaisuus

3. Markovin prosessit ja vahva Markovin ominaisuus 30 STOKASTISET DIFFERENTIAALIYHTÄLÖT 3. Marovin prosessit ja vahva Marovin ominaisuus Aloitamme nyt edellisen appaleen päättäneen esimerin yleistämisen Brownin liieelle. Käymme ysitellen läpi esimerin

Lisätiedot

Keskipisteen lisääminen 2 k -faktorikokeeseen (ks. Montgomery 9-6)

Keskipisteen lisääminen 2 k -faktorikokeeseen (ks. Montgomery 9-6) Mat-.3 Koesuunnittelu ja tilastolliset mallit kevät Keskipisteen lisääminen k -faktorikokeeseen (ks. Montgomery 9-6) Esim (Montg. ex. 9-, 6-): Tutkitaan kemiallisen prosessin saannon Y riippuvuutta faktoreista

Lisätiedot

Matematiikan tukikurssi

Matematiikan tukikurssi Matematiian tuiurssi Kurssierta 5 Sarjojen suppeneminen Kiinnostusen ohteena on edelleen sarja a n = a + a 2 + a 3 + a 4 + n= Tämä summa on mahdollisesti äärellisenä olemassa, jolloin sanotaan että sarja

Lisätiedot

DISKREETIN MATEMATIIKAN SOVELLUKSIA: KANAVA-EKVALISOINTI TIEDONSIIRROSSA. Taustaa

DISKREETIN MATEMATIIKAN SOVELLUKSIA: KANAVA-EKVALISOINTI TIEDONSIIRROSSA. Taustaa Disreetin matematiian excursio: anava-evalisointi tiedonsiirrossa / DISKREETIN MATEMATIIKAN SOVELLUKSIA: KANAVA-EKVALISOINTI TIEDONSIIRROSSA Taustaa Disreetin matematiian excursio: anava-evalisointi tiedonsiirrossa

Lisätiedot

TA7, Ekonometrian johdantokurssi HARJOITUS 4 1 RATKAISUEHDOTUKSET

TA7, Ekonometrian johdantokurssi HARJOITUS 4 1 RATKAISUEHDOTUKSET TA7, Ekonometrian johdantokurssi HARJOITUS 4 1 RATKAISUEHDOTUKSET 16..015 1. a Poliisivoimien suuruuden lisäksi piirikuntien rikostilastoihin vaikuttaa monet muutkin tekijät. Esimerkiksi asukkaiden keskimääräinen

Lisätiedot

4.3 Erillisten joukkojen yhdisteet

4.3 Erillisten joukkojen yhdisteet 4.3 Erillisten jouojen yhdisteet Ongelmana on pitää yllä ooelmaa S 1,..., S perusjouon X osajouoja, jota voivat muuttua ajan myötä. Rajoitusena on, että miään alio x ei saa uulua useampaan uin yhteen jouoon.

Lisätiedot

1. Tilastollinen malli??

1. Tilastollinen malli?? 1. Tilastollinen malli?? https://fi.wikipedia.org/wiki/tilastollinen_malli https://en.wikipedia.org/wiki/statistical_model http://projecteuclid.org/euclid.aos/1035844977 Tilastollinen malli?? Numeerinen

Lisätiedot

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä arvon Sisältö arvon Bootstrap-luottamusvälit arvon arvon Oletetaan, että meillä on n kappaletta (x 1, y 1 ),

Lisätiedot

HY, MTO / Matemaattisten tieteiden kandiohjelma Tilastollinen päättely II, kevät 2018 Harjoitus 6A Ratkaisuehdotuksia.

HY, MTO / Matemaattisten tieteiden kandiohjelma Tilastollinen päättely II, kevät 2018 Harjoitus 6A Ratkaisuehdotuksia. HY, MTO / Matemaattiste tieteide adiohjelma Tilastollie päättely II, evät 2018 Harjoitus 6A Rataisuehdotusia Tehtäväsarja I 1. (Moistee tehtävä 5.4) Kauppias myy mäysiemeiä, joide itävyyde väitetää oleva

Lisätiedot

Joulukuun vaativammat valmennustehtävät ratkaisut

Joulukuun vaativammat valmennustehtävät ratkaisut Jouluuun vaativammat valmennustehtävät rataisut. Tapa. Pätee z = x + y, joten z = (x + y = x + y, josta sieventämällä seuraa xy 4x 4y + 4 = 0. Siispä (x (y =. Tästä yhtälöstä saadaan suoraan x =, y = 4

Lisätiedot

SYMBOLIVIRHETODENNÄKÖISYYDESTÄ BITTIVIRHETODENNÄKÖISYYTEEN

SYMBOLIVIRHETODENNÄKÖISYYDESTÄ BITTIVIRHETODENNÄKÖISYYTEEN SYMBOLIVIRHETODENNÄKÖISYYDESTÄ BITTIVIRHETODENNÄKÖISYYTEEN Miten modulaation P S P B? 536A Tietoliienneteniia II Osa 4 Kari Käräinen Sysy 05 SEP VS. BEP D-SIGNAALIAVARUUDESSA Kullein modulaatiolle johdetaan

Lisätiedot

(1 + i) + JA. t=1. t=1. (1 + i) n (1 + i) n. = H + k (1 + i)n 1 i(1 + i) n + JA

(1 + i) + JA. t=1. t=1. (1 + i) n (1 + i) n. = H + k (1 + i)n 1 i(1 + i) n + JA Investoinnin annattavuuden mittareita Opetusmonisteessa on asi sivua, joilla on hyvin lyhyesti uvattu jouo mittareita. Seuraavassa on muutama lisäommentti ja aavan-johto. Tarastelemme projetia, jona perusinvestointi

Lisätiedot

Dynaamiset regressiomallit

Dynaamiset regressiomallit MS-C2128 Ennustaminen ja Aikasarja-analyysi, Lauri Viitasaari Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2016 Tilastolliset aikasarjat voidaan jakaa kahteen

Lisätiedot

C (4) 1 x + C (4) 2 x 2 + C (4)

C (4) 1 x + C (4) 2 x 2 + C (4) http://matematiialehtisolmu.fi/ Kombiaatio-oppia Kuia mota erilaista lottoriviä ja poeriättä o olemassa? Lotossa arvotaa 7 palloa 39 pallo jouosta. Poeriäsi o viide orti osajouo 52 orttia äsittävästä paasta.

Lisätiedot

Harjoitus 9: Excel - Tilastollinen analyysi

Harjoitus 9: Excel - Tilastollinen analyysi Harjoitus 9: Excel - Tilastollinen analyysi Mat-2.2107 Sovelletun matematiikan tietokonetyöt Syksy 2006 Mat-2.2107 Sovelletun matematiikan tietokonetyöt 1 Harjoituksen aiheita Tutustuminen regressioanalyysiin

Lisätiedot

r = r f + r M r f (Todistus kirjassa sivulla 177 tai luennon 6 kalvoissa sivulla 6.) yhtälöön saadaan ns. CAPM:n hinnoittelun peruskaava Q P

r = r f + r M r f (Todistus kirjassa sivulla 177 tai luennon 6 kalvoissa sivulla 6.) yhtälöön saadaan ns. CAPM:n hinnoittelun peruskaava Q P Markkinaportfolio on koostuu kaikista markkinoilla olevista riskipitoisista sijoituskohteista siten, että sijoituskohteiden osuudet (so. painot) markkinaportfoliossa vastaavat kohteiden markkina-arvojen

Lisätiedot

Yleistetyistä lineaarisista malleista

Yleistetyistä lineaarisista malleista Yleistetyistä lineaarisista malleista Tilastotiede käytännön tutkimuksessa -kurssi, kesä 2001 Reijo Sund Klassinen lineaarinen malli y = Xb + e eli E(Y) = m, jossa m = Xb Satunnaiskomponentti: Y:n komponentit

Lisätiedot

Vakuutusteknisistä riskeistä johtuvien suureiden laskemista varten käytettävä vakuutuslajiryhmittely.

Vakuutusteknisistä riskeistä johtuvien suureiden laskemista varten käytettävä vakuutuslajiryhmittely. 1144/2011 7 Liite 1 Vauutustenisistä riseistä johtuvien suureiden lasemista varten äytettävä vauutuslajiryhmittely. Vauutuslajiryhmä Vauutusluoat Ensivauutus 1 Laisääteinen tapaturma 1 (laisääteinen) 2

Lisätiedot

MTTTP5, luento Luottamusväli, määritelmä

MTTTP5, luento Luottamusväli, määritelmä 23.11.2017/1 MTTTP5, luento 23.11.2017 Luottamusväli, määritelmä Olkoot A ja B satunnaisotoksen perusteella määriteltyjä satunnaismuuttujia. Väli (A, B) on parametrin 100(1 - ) %:n luottamusväli, jos P(A

Lisätiedot

2. Teoriaharjoitukset

2. Teoriaharjoitukset 2. Teoriaharjoitukset Demotehtävät 2.1 Todista Gauss-Markovin lause. Ratkaisu. Oletetaan että luentokalvojen standardioletukset (i)-(v) ovat voimassa. Huomaa että Gauss-Markovin lause ei vaadi virhetermien

Lisätiedot

Tehtävä 3. Määrää seuraavien jonojen raja-arvot 1.

Tehtävä 3. Määrää seuraavien jonojen raja-arvot 1. Jonotehtävät, 0/9/005, sivu / 5 Perustehtävät Tehtävä. Muotoile matemaattiset vastineet seuraavien väitteiden negaatioille (ts. vastaohdat).. Jono (a n ) suppenee ohti luua a.. Jono (a n ) on asvava. 3.

Lisätiedot

Johdatus tilastotieteeseen Yleinen lineaarinen malli. TKK (c) Ilkka Mellin (2004) 1

Johdatus tilastotieteeseen Yleinen lineaarinen malli. TKK (c) Ilkka Mellin (2004) 1 Johdatus tilastotieteeseen Yleinen lineaarinen malli TKK (c) Ilkka Mellin (2004) 1 Yleinen lineaarinen malli Usean selittäjän lineaarinen regressiomalli Yleisen lineaarisen mallin matriisisesitys Yleisen

Lisätiedot

Ilkka Mellin Tilastolliset menetelmät. Osa 4: Lineaarinen regressioanalyysi. Yleinen lineaarinen malli. TKK (c) Ilkka Mellin (2007) 1

Ilkka Mellin Tilastolliset menetelmät. Osa 4: Lineaarinen regressioanalyysi. Yleinen lineaarinen malli. TKK (c) Ilkka Mellin (2007) 1 Ilkka Mellin Tilastolliset menetelmät Osa 4: Lineaarinen regressioanalyysi Yleinen lineaarinen malli TKK (c) Ilkka Mellin (2007) 1 Yleinen lineaarinen malli >> Usean selittäjän lineaarinen regressiomalli

Lisätiedot

MAB7 Talousmatematiikka. Otavan Opisto / Kati Jordan

MAB7 Talousmatematiikka. Otavan Opisto / Kati Jordan 3.3 Laiat MAB7 Talousmatematiia Otava Opisto / Kati Jorda Laia ottamie Suuri osa ihmisistä ottaa laiaa jossai elämävaiheessa. Pailaiaa tarvitaa yleesä vauusia ja/tai taausia. Laiatulle pääomalle masetaa

Lisätiedot

Sattuman matematiikkaa III

Sattuman matematiikkaa III Sattuman matematiiaa III Kolmogorovin asioomat ja frevenssitulinta Tommi Sottinen Tutija Matematiian ja tilastotieteen laitos, Helsingin yliopisto Laboratoire de Probabilités et Modèles Aléatoires, Université

Lisätiedot

Testit laatueroasteikollisille muuttujille

Testit laatueroasteikollisille muuttujille Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Testit laatueroasteikollisille muuttujille TKK (c) Ilkka Mellin (2007) 1 Testit laatueroasteikollisille muuttujille >> Laatueroasteikollisten

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 22. marraskuuta 2007 Antti Rasila () TodB 22. marraskuuta 2007 1 / 17 1 Epäparametrisia testejä (jatkoa) χ 2 -riippumattomuustesti 2 Johdatus regressioanalyysiin

Lisätiedot

Tilastollinen aineisto Luottamusväli

Tilastollinen aineisto Luottamusväli Tilastollinen aineisto Luottamusväli Keijo Ruotsalainen Oulun yliopisto, Teknillinen tiedekunta Matematiikan jaos Tilastollinen aineisto p.1/20 Johdanto Kokeellisessa tutkimuksessa tutkittavien suureiden

Lisätiedot

5.7 Uskottavuusfunktioon perustuvia testejä II

5.7 Uskottavuusfunktioon perustuvia testejä II 5.7 Uskottavuusfunktioon perustuvia testejä II Tässä pykälässä pohditaan edellä tarkasteltujen kolmen testisuureen yleistystä malleihin, joiden parametri on useampiulotteinen, ja testausasetelmiin, joissa

Lisätiedot

ATH-aineiston tilastolliset analyysit SPSS/PASW SPSS analyysit / Risto Sippola 1

ATH-aineiston tilastolliset analyysit SPSS/PASW SPSS analyysit / Risto Sippola 1 ATH-aineiston tilastolliset analyysit SPSS/PASW 16.2.2011 SPSS analyysit / Risto Sippola 1 Aineiston avaaminen Aineisto on saatu SPSS-muotoon ja tallennettu koneelle sijaintiin, josta sitä voidaan käyttää

Lisätiedot

Estimointi. Vilkkumaa / Kuusinen 1

Estimointi. Vilkkumaa / Kuusinen 1 Estimointi Vilkkumaa / Kuusinen 1 Motivointi Tilastollisessa tutkimuksessa oletetaan jonkin jakauman generoineen tutkimuksen kohteena olevaa ilmiötä koskevat havainnot Tämän mallina käytettävän todennäköisyysjakauman

Lisätiedot

Mat Tilastollisen analyysin perusteet, kevät 2007

Mat Tilastollisen analyysin perusteet, kevät 2007 Usea selittää lieaarie regressiomalli Mat-.04 Tilastollise aalyysi perusteet, evät 007 8. lueto: Usea selittää lieaarie regressiomalli Selitettävä muuttua havaittue arvoe vaihtelu halutaa selittää selittävie

Lisätiedot