Yhden selittäjän lineaarinen regressiomalli (jatkoa) Ensi viikolla ei pidetä luentoa eikä harjoituksia. Heliövaara 1

Samankaltaiset tiedostot
Regressioanalyysi. Kuusinen/Heliövaara 1

Regressioanalyysi. Vilkkumaa / Kuusinen 1

ABHELSINKI UNIVERSITY OF TECHNOLOGY

Johdatus regressioanalyysiin. Heliövaara 1

Mat Tilastollisen analyysin perusteet, kevät 2007

Johdatus tilastotieteeseen Yleinen lineaarinen malli. TKK (c) Ilkka Mellin (2004) 1

Ilkka Mellin Tilastolliset menetelmät. Osa 4: Lineaarinen regressioanalyysi. Yleinen lineaarinen malli. TKK (c) Ilkka Mellin (2007) 1

Harjoitus 9: Excel - Tilastollinen analyysi

Erityiskysymyksiä yleisen lineaarisen mallin soveltamisessa

Mat Tilastollisen analyysin perusteet, kevät 2007

Tilastollisen analyysin perusteet Luento 7: Lineaarinen regressio

Tilastollisen analyysin perusteet Luento 9: Moniulotteinen lineaarinen. regressio

Johdatus tilastotieteeseen Regressiomallin valinta. TKK (c) Ilkka Mellin (2004) 1

Yleinen lineaarinen malli

Kaksisuuntainen varianssianalyysi. Heliövaara 1

Ilkka Mellin Tilastolliset menetelmät. Osa 4: Lineaarinen regressioanalyysi. Regressiomallin valinta. TKK (c) Ilkka Mellin (2007) 1

Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1

2. Teoriaharjoitukset

Dynaamiset regressiomallit

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

Johdatus tilastotieteeseen Regressiodiagnostiikka. TKK (c) Ilkka Mellin (2004) 1

Lohkoasetelmat. Heliövaara 1

Sovellettu todennäköisyyslaskenta B

Mat Tilastollisen analyysin perusteet, kevät 2007

Korrelaatiokertoinen määrittely 165

Sovellettu todennäköisyyslaskenta B

Lohkoasetelmat. Vilkkumaa / Kuusinen 1

Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1

Harjoitus 3: Regressiomallit (Matlab)

Ilkka Mellin Tilastolliset menetelmät. Osa 4: Lineaarinen regressioanalyysi. Regressiodiagnostiikka. TKK (c) Ilkka Mellin (2007) 1

805306A Johdatus monimuuttujamenetelmiin, 5 op

Harjoitus 3: Regressiomallit (Matlab)

TA7, Ekonometrian johdantokurssi HARJOITUS 4 1 RATKAISUEHDOTUKSET

Yhden selittäjän lineaarinen regressiomalli

Kaksisuuntainen varianssianalyysi. Vilkkumaa / Kuusinen 1

Lohkoasetelmat. Kuusinen/Heliövaara 1

Mat Tilastollisen analyysin perusteet, kevät 2007

Aalto-yliopisto, Matematiikan ja systeemianalyysin laitos /Malmivuori MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi,

Vastepintamenetelmä. Kuusinen/Heliövaara 1

Väliestimointi (jatkoa) Heliövaara 1

Odotusarvoparien vertailu. Vilkkumaa / Kuusinen 1

Johdatus varianssianalyysiin. Vilkkumaa / Kuusinen 1

MS-A0204 Differentiaali- ja integraalilaskenta 2 (ELEC2) Luento 7: Pienimmän neliösumman menetelmä ja Newtonin menetelmä.

Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt: Mitä opimme? Latinalaiset neliöt

Harha mallin arvioinnissa

Osa 2: Otokset, otosjakaumat ja estimointi

Ilkka Mellin Aikasarja-analyysi Suurimman uskottavuuden menetelmä

2.1. Parametrien estimointi 2.2. Regressiokertoimien estimointi kovariansseista ja korrelaatioista

Vastepintamenetelmä. Heliövaara 1

Johdatus todennäköisyyslaskentaan Moniulotteisia todennäköisyysjakaumia. TKK (c) Ilkka Mellin (2005) 1

Moniulotteisia todennäköisyysjakaumia. Moniulotteisia todennäköisyysjakaumia. Moniulotteisia todennäköisyysjakaumia: Mitä opimme?

Moniulotteisia todennäköisyysjakaumia

Johdatus regressioanalyysiin

Gripenberg. MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Tentti ja välikoeuusinta

1. Tutkitaan regressiomallia Y i = β 0 + β 1 X i + u i ja oletetaan, että tavanomaiset

Ilkka Mellin Todennäköisyyslaskenta Osa 3: Todennäköisyysjakaumia Moniulotteisia todennäköisyysjakaumia

1. YKSISUUNTAINEN VARIANSSIANALYYSI: AINEISTON ESITYSMUODOT

xi = yi = 586 Korrelaatiokerroin r: SS xy = x i y i ( x i ) ( y i )/n = SS xx = x 2 i ( x i ) 2 /n =

Regressiodiagnostiikka ja regressiomallin valinta

1. Tutkitaan tavallista kahden selittäjän regressiomallia

Regressiodiagnostiikka ja regressiomallin valinta

Johdatus tilastotieteeseen Johdatus regressioanalyysiin. TKK (c) Ilkka Mellin (2005) 1

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Simuloinnin strategisia kysymyksiä

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?

Simuloinnin strategisia kysymyksiä

Harjoitus 2: Matlab - Statistical Toolbox

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1

Lineaarialgebra, kertausta aiheita

031021P Tilastomatematiikka (5 op) viikko 6

Vastepintamenetelmä. Vilkkumaa / Kuusinen 1

Harjoitusten 4 vastaukset

4.0.2 Kuinka hyvä ennuste on?

Lineaarinen malli. Pentti Saikkonen. Kevät Korjattu versio: Toukokuu 2011

Lineaarialgebra II, MATH.1240 Matti laaksonen, Lassi Lilleberg

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2005) 1

Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi

Ilkka Mellin Aikasarja-analyysi. Dynaamiset regressiomallit. TKK (c) Ilkka Mellin (2006) 1

Koesuunnittelu 2 k -faktorikokeet. TKK (c) Ilkka Mellin (2005) 1

5.7 Uskottavuusfunktioon perustuvia testejä II

Testejä suhdeasteikollisille muuttujille

Johdatus tilastotieteeseen Tilastollinen riippuvuus ja korrelaatio. TKK (c) Ilkka Mellin (2005) 1

031021P Tilastomatematiikka (5 op) viikko 6

Pienimmän neliösumman menetelmä (PNS)

Mat Tilastollisen analyysin perusteet, kevät 2007

Yleistetyistä lineaarisista malleista

Koesuunnittelu Vastepintamenetelmä. TKK (c) Ilkka Mellin (2005) 1

MS-C1340 Lineaarialgebra ja differentiaaliyhtälöt

Todennäköisyyden ominaisuuksia

Spatiaalisiin merkkeihin ja järjestyslukuihin perustuva moniulotteinen regressioanalyysi R-ohjelmistoa käyttäen

Pienimmän neliösumman menetelmä (PNS)

Pienimmän neliösumman menetelmä (PNS)

Lause 4.2. Lineearinen pienimmän keskineliövirheen estimaattoi on lineaarinen projektio.

Inversio-ongelmien laskennallinen peruskurssi Luento 2

tilastotieteen kertaus

edellyttää valintaa takaisinpanolla Aritmeettinen keskiarvo Jos, ½ Ò muodostavat satunnaisotoksen :n jakaumasta niin Otosvarianssi Ë ¾

Lineaariset luokittelumallit: regressio ja erotteluanalyysi

Inversio-ongelmien laskennallinen peruskurssi Luento 4

Lineaarinen malli. Pentti Saikkonen. Kevät Korjattu versio: Toukokuu 2010

Transkriptio:

Yhden selittäjän lineaarinen regressiomalli (jatkoa) Ensi viikolla ei pidetä luentoa eikä harjoituksia Heliövaara 1

Regressiokertoimien PNS-estimaattorit Määritellään havaintojen x j ja y j, j = 1, 2,...,n aritmeettiset keskiarvot ( x ja ȳ), otosvarianssit (s 2 x ja s2 y ), otoskovarianssi (s xy) ja otoskorrelaatiokerroin (r xy ) tavanomaisilla kaavoillaan. Yhden selittäjän lineaarisen regressiomallin regressiokertoimien β 0 ja β 1 PNS-estimaattorit ovat b 0 = ȳ b 1 x b 1 = s xy s 2 x = r xy s y s x Heliövaara 2

Regressiokerrointen PNS-estimaattoreiden jakaumat Regressiokertoimien β 0 ja β 1 PNS-estimaattoreiden b 0 ja b 1 otosjakaumat ovat missä ( b 1 N β 1, σ 2 nˆσ 2 x σ 2 = Var(ε j ) on jäännösvarianssi. ), b 0 N (β 0, σ2 n i=1 x2 i n 2ˆσ x 2 ˆσ 2 x = 1 n n j=1 (x j x) 2 on x:n harhainen otosvarianssi. ), Heliövaara 3

Regressiokertoimia koskevat testit Ilkka Mellinin kaavakokoelmasta Sovellettu todennäköisyyslasku: Kaavat ja taulukot löytyy tietoa regressiokertoimia koskevista testeistä. Heliövaara 4

Yleinen lineaarinen malli Heliövaara 5

Usean selittäjän lineaarinen regressiomalli Usean selittäjän lineaarisessa regressiomallissa selitettävän muuttujan y havaittujen arvojen vaihtelu halutaan selittää selittävien muuttujien x 1,x 2,...,x k havaittujen arvojen vaihtelun avulla. Usean selittäjän lineaarista regressiomallia kutsutaan tavallisesti yleiseksi lineaariseksi malliksi. Heliövaara 6

Havainnot Selitettävää muuttujaa y ja selittäjiä x 1,x 2,...,x k koskevat havaintoarvot voidaan järjestää havaintoyksiköittäin seuraavasti: Havaintoyksikkö 1: x 11,x 12,...,x 1k,y 1 Havaintoyksikkö 2: x 21,x 22,...,x 2k,y 2.. Havaintoyksikkö 1: x n1,x n2,...,x nk,y n Missä k = selittäjien x i lukumäärä. n = havaintojen lukumäärä. Heliövaara 7

Yleinen lineaarinen malli Yhtälö y j = β 0 + β 1 x j1 + β 2 x j2 + + β k x jk + ε j, j = 1, 2,...,n määrittelee yleisen lineaarisen mallin, jossa on seuraavat kertoimet: β 0 = vakioselittäjän regressiokerroin. β i = selittäjän x i regressiokerroin. Heliövaara 8

Standardioletukset Yleisen lineaarisen mallin standardioletukset ovat: (i) Selittäjien x i arvot x ji ovat ei-satunnaisia vakioita, j = 1, 2,...,n, i = 1, 2,...,k (ii) Selittäjien välillä ei ole lineaarisia riippuvuuksia. (iii) E(ε j ) = 0, j = 1, 2,...,n (iv) Var(ε j ) = σ 2, j = 1, 2,...,n (v) Cor(ε j,ε l ) = 0, j l (vi) ε j N(0,σ 2 ), j = 1, 2,...,n Standardioletusten voimassaolo takaa, että ns. tavanomaisia estimointi- ja testausmenetelmiä saa käyttää mallin analysoinnissa. Heliövaara 9

Regressiotaso Standardioletusten pätiessä selitettävän muuttujan odotusarvo on muotoa E(y j ) = β 0 + β 1 x j1 + β 2 x j2 + + β k x jk, j = 1, 2,...,n Tätä odotusarvoa kutsutaan mallin systemaattiseksi osaksi. Systemaattinen osa määrittelee tason y = β 0 + β 1 x j1 + β 2 x j2 + + β k x jk avaruudessa R k+1, jota kutsutaan regressiotasoksi. Heliövaara 10

Yleinen lineaarinen malli - matriisiesitys Heliövaara 11

Selitettävän ja selittävien muuttujien matriisit Olkoon y = [y 1 y 2 y n ] selitettävän muuttujan y havaittujen arvojen muodostama n-vektori. Olkoon X = 1 x 11 x 12 x 1k 1 x 21 x 22 x 2k......... 1 x n1 x n2 x nk selittävien muuuttujien x 1,x 2,...,x k havaittujen arvojen ja ykkösten muodostama n (k + 1)-matriisi. Matriisin X ykkösten muodostama sarake vastaa mallin vakioselittäjää. Heliövaara 12

Regressiokertoimien matriisi Olkoon β = [β 0 β 1 β k ] regressiokertoimien β 0,β 1,...,β k muodostama (k + 1)-vektori. Olkoon ε = [ε 1 ε 2 ε n ] jäännöstermien ε 1,ε 2,...,ε n muodostama n-vektori. Heliövaara 13

Yleisen lineaarisen mallin matriisiesitys Yleinen lineaarinen malli voidaan esittää matriisein muodossa y = Xβ + ε Heliövaara 14

Yleisen lineaarisen mallin parametrien estimointi Yleisen lineaarisen mallin y j = β 0 + β 1 x j1 + β 2 x j2 + + β k x jk + ε j, j = 1, 2,...,n regressiokertoimet β 0,β 1,...,β k estimoidaan tavallisesti pienimmän neliösumman menetelmällä. PNS-menetelmässä regressiokertoiminen estimaattorit määrätään minimoimalla jäännöstermien ε j neliösumma n j=1 ε 2 j = n (y j β 0 β 1 x j1 β 2 x j2 β k x jk ) 2 j=1 regressiokertoimien β 0,β 1,...,β k suhteen. Heliövaara 15

Regressiokertoimien PNS-estimaattorit Olkoon y = Xβ + ε standardioletuksen (ii) r(x) = k + 1 toteuttava yleinen lineaarinen malli. Tällöin regressiokertoimien vektorin β PNS-estimaattori on b = (X X) 1 X y Heliövaara 16