Vastepintamenetelmä. Heliövaara 1

Samankaltaiset tiedostot
Vastepintamenetelmä. Kuusinen/Heliövaara 1

Vastepintamenetelmä. Vilkkumaa / Kuusinen 1

Osafaktorikokeet. Kurssipalautetta voi antaa Oodissa Kuusinen/Heliövaara 1

Koesuunnittelu Vastepintamenetelmä. TKK (c) Ilkka Mellin (2005) 1

Koesuunnittelu 2 k -faktorikokeet. TKK (c) Ilkka Mellin (2005) 1

Kaksisuuntainen varianssianalyysi. Heliövaara 1

Lohkoasetelmat. Heliövaara 1

Hierarkkiset koeasetelmat. Heliövaara 1

Kaksisuuntainen varianssianalyysi. Vilkkumaa / Kuusinen 1

Lohkoasetelmat. Kuusinen/Heliövaara 1

Lohkoasetelmat. Vilkkumaa / Kuusinen 1

Kertausluento. Vilkkumaa / Kuusinen 1

Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt: Mitä opimme? Latinalaiset neliöt

2 k -faktorikokeet. Vilkkumaa / Kuusinen 1

Toimittaja Erä

Keskipisteen lisääminen 2 k -faktorikokeeseen (ks. Montgomery 9-6)

Johdatus varianssianalyysiin. Vilkkumaa / Kuusinen 1

2 2 -faktorikokeen määritelmä

Regressioanalyysi. Kuusinen/Heliövaara 1

Johdatus regressioanalyysiin. Heliövaara 1

Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1

Regressioanalyysi. Vilkkumaa / Kuusinen 1

Useampisuuntainen varianssianalyysi. Useampisuuntainen varianssianalyysi. Useampisuuntainen varianssianalyysi

Yhden selittäjän lineaarinen regressiomalli (jatkoa) Ensi viikolla ei pidetä luentoa eikä harjoituksia. Heliövaara 1

Kaksisuuntaisen varianssianalyysin tilastollisessa malli voidaan esittää seuraavassa muodossa:

Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1

MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op)

Koesuunnittelu Latinalaiset neliöt. TKK (c) Ilkka Mellin (2005) 1

Mat Tilastollisen analyysin perusteet, kevät 2007

ABHELSINKI UNIVERSITY OF TECHNOLOGY

Mat Tilastollisen analyysin perusteet, kevät 2007

Harjoitus 9: Excel - Tilastollinen analyysi

Johdatus tilastotieteeseen Kaksisuuntainen varianssianalyysi. TKK (c) Ilkka Mellin (2005) 1

MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op)

Odotusarvoparien vertailu. Vilkkumaa / Kuusinen 1

Altistusaika 1 kk 2 kk 3 kk

Sovellettu todennäköisyyslaskenta B

MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op)

Mat Tilastollisen analyysin perusteet, kevät 2007

Johdatus tilastotieteeseen Yleinen lineaarinen malli. TKK (c) Ilkka Mellin (2004) 1

Mat Tilastollisen analyysin perusteet, kevät 2007

1. YKSISUUNTAINEN VARIANSSIANALYYSI: AINEISTON ESITYSMUODOT

MS-A0204 Differentiaali- ja integraalilaskenta 2 (ELEC2) Luento 7: Pienimmän neliösumman menetelmä ja Newtonin menetelmä.

1 Rajoittamaton optimointi

Tilastollisen analyysin perusteet Luento 7: Lineaarinen regressio

Yleistetyistä lineaarisista malleista

Väliestimointi (jatkoa) Heliövaara 1

Lohkoasetelmat. Lohkoasetelmat. Lohkoasetelmat: Mitä opimme? Lohkoasetelmat. Lohkoasetelmat. Satunnaistettu täydellinen lohkoasetelma 1/4

Tilastollisen analyysin perusteet Luento 9: Moniulotteinen lineaarinen. regressio

min x x2 2 x 1 + x 2 1 = 0 (1) 2x1 1, h = f = 4x 2 2x1 + v = 0 4x 2 + v = 0 min x x3 2 x1 = ± v/3 = ±a x 2 = ± v/3 = ±a, a > 0 0 6x 2

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B

Ilkka Mellin Tilastolliset menetelmät. Osa 4: Lineaarinen regressioanalyysi. Yleinen lineaarinen malli. TKK (c) Ilkka Mellin (2007) 1

USEAN MUUTTUJAN REGRESSIOMALLIT JA NIIDEN ANA- LYYSI

1. YKSISUUNTAINEN VARIANSSIANALYYSI: AINEISTON ESITYSMUODOT

Osafaktorikokeet. Heliövaara 1

1. KAKSISUUNTAINEN VARIANSSIANALYYSI: TULOSTEN TULKINTA

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

Erityiskysymyksiä yleisen lineaarisen mallin soveltamisessa

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin

Sovellettu todennäköisyyslaskenta B

2. Teoriaharjoitukset

Inversio-ongelmien laskennallinen peruskurssi Luento 2

TA7, Ekonometrian johdantokurssi HARJOITUS 4 1 RATKAISUEHDOTUKSET

ABHELSINKI UNIVERSITY OF TECHNOLOGY

Likimääräisratkaisut ja regularisaatio

Mat Tilastollisen analyysin perusteet, kevät 2007

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Testejä suhdeasteikollisille muuttujille

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

1. Tilastollinen malli??

Numeeriset menetelmät TIEA381. Luento 8. Kirsi Valjus. Jyväskylän yliopisto. Luento 8 () Numeeriset menetelmät / 35

Diskriminanttianalyysi I

Numeeriset menetelmät

Yleinen lineaarinen malli

k=0 saanto jokaisen kolmannen asteen polynomin. Tukipisteet on talloin valittu

Numeeriset menetelmät TIEA381. Luento 12. Kirsi Valjus. Jyväskylän yliopisto. Luento 12 () Numeeriset menetelmät / 33

Logistinen regressio, separoivat hypertasot

Todennäköisyyden ominaisuuksia

BM20A5840 Usean muuttujan funktiot ja sarjat Harjoitus 7, Kevät 2018

(0 desimaalia, 2 merkitsevää numeroa).

Johdatus regressioanalyysiin

4.0.2 Kuinka hyvä ennuste on?

9.1 Hierarkiset asetelmat (Nested Designs)

Harjoitus 7: NCSS - Tilastollinen analyysi

Jos nyt on saatu havaintoarvot Ü ½ Ü Ò niin suurimman uskottavuuden

Mat Tilastollisen analyysin perusteet, kevät 2007

Koodausteoria, Kesä 2014

031021P Tilastomatematiikka (5 op) kertausta 2. vk:een

VARIANSSIANALYYSI ANALYSIS OF VARIANCE

5. Johdatus faktorikokeisiin. Tekijän omaa vaikutusta vastemuuttujaan sanotaan. 5.1 Taustaa

Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Mat Tilastollisen analyysin perusteet, kevät 2007

Numeeriset menetelmät

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu

Pienimmän neliösumman menetelmä

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2005) 1

Matriisialgebra harjoitukset, syksy 2016

Matematiikka B1 - avoin yliopisto

Esim Brand lkm keskiarvo keskihajonta A ,28 5,977 B ,06 3,866 C ,95 4,501

Transkriptio:

Vastepintamenetelmä Kurssipalautteen antamisesta saa hyvityksenä yhden tenttipisteen. Palautelomakkeeseen tulee lähiaikoina linkki kurssin kotisivuille. Heliövaara 1

Vastepintamenetelmä Vastepintamenetelmässä pyritään vasteen riippuvuutta siihen vaikuttavista tekijöistä approksimoimaan tekijöiden polynomimuotoisella funktiolla, jota kutsutaan vastepintamalliksi. Polynomimuotoisten vastepintamallien avulla on helppo etsiä vasteeseen vaikuttavien tekijöiden optimaalista kombinaatiota. Vastepintamenetelmä on vaiheittain etenevä mallinrakentamisstrategia, jonka aikana joudutaan tavallisesti keräämään myös uusia havaintoja. Heliövaara 2

Vastepintamenetelmä Oletetaan, että vastemuuttujan y havaittujen arvojen riippuvuutta tekijöiden x 1,x 2,...,x k tasoista voidaan kuvata funktiolla y = f(x 1,x 2,...,x k ) + ε jossa jäännöstermi ε edustaa satunnaisvirhettä muuttujan y havaituissa arvoissa. Vastepintamenetelmän tavoitteena on löytää sellainen tekijöiden x 1,x 2,...,x k tasojen kombinaatio, joka optimoi (minimoi tai maksimoi) vastefunktion arvon. f(x 1,x 2,...,x k ) Heliövaara 3

Vastepintamenetelmä Funktion f muoto on tavallisesti tuntematon ja siksi funktiota pyritään approksimoimaan sopivasti valitulla faktoreiden polynomilla. Tällöin on tärkeää selvittää riittäkö funktiolle f lineaarinen approksimaatio vai tarvitaanko jotakin korkeampiasteista approksimaatiota. Tällä kurssilla tarkastelemme vastepintamenetelmää 2 2 -faktorikokeiden yhteydessä. Heliövaara 4

Vastepintamenetelmä 2 2 -faktorikokeissa Heliövaara 5

Luonnolliset muuttujat Kutsumme tekijöitä A ja B luonnollisiksi muuttujiksi, jos niiden arvot on annettu tekijöiden oikeissa, luonnollisissa mittayksiköissä. Olkoon X + =Tekijän X arvo, kun tekijän X taso on korkea (+) X jossa =Tekijän X arvo, kun tekijän X taso on matala ( ) X = A,B Heliövaara 6

Koodatut muuttujat Olkoon x = X (X + + X )/2 (X + X )/2 luonnollista muuttujaa X vastaava koodattu muuttuja. Tällöin x = +1, jos X = X + 1, jos X = X Kääntäen, luonnollisen muuttujan X arvot saadaan koodatun muuttujan x arvoista kaavalla X = 1 2 (X + X )x + 1 2 (X + + X ) Heliövaara 7

1. asteen lineaarinen vastepintamalli Määritellään 1. asteen lineaarinen vastepintamalli kaavalla jossa y = β 0 + β 1 x 1 + β 2 x 2 + ε x 1 x 2 =Tekijää A vastaava koodattu muuttuja =Tekijää B vastaava koodattu muuttuja Mallin avulla voidaan mallintaa tekijöiden A ja B päävaikutukset. Malli ei kykene huomioimaan vastefunktion f mahdollista kaarevuutta. Heliövaara 8

1. asteen vastepintamalli 1/2 Lisäämällä 1. asteen lineaariseen vastepintamalliin koodattujen muuttujien x 1 ja x 2 tulotermi, joka kuvaa tekijöiden A ja B yhteisvaikutusta, saadaan 1. asteen vastepintamalli y = β 0 + β 1 x 1 + β 2 x 2 + β 12 x 1 x 2 + ε Mallin avulla voidaan mallintaa tekijöiden A ja B päävaikutukset ja yhdysvaikutus eli interaktio. Malli kykenee jonkin verran huomioimaan vastefunktion f mahdollista kaarevuutta. Heliövaara 9

1. asteen vastepintamalli 2/2 Vastepintamallit ovat parametrien suhteen tavanomaisia lineaarisia regressiomalleja, joiden parametrit voidaan estimoida pienimmän neliösumman menetelmällä. 1. asteen vastepintamallin parametrien β 0,β 1,β 2,β 12 PNS-estimaattorit ovat b 0 = ȳ b 2 = X B /2 b 1 = X A /2 b 12 = X AB /2 Estimoitu 1. asteen vastepinnan yhtälö on siis muotoa ŷ = ȳ + ( XA 2 ) x 1 + ( XB 2 ) x 2 + ( XAB 2 ) x 1 x 2 Heliövaara 10

Vastefunktion kaarevuuden testaaminen Heliövaara 11

Kvadraattisen kaarevuuden testaaminen 2 2 -koeasetelmassa sovellettavan 1. asteen vastepintamallin y = β 0 + β 1 x 1 + β 2 x 2 + β 12 x 1 x 2 + ε riittävyyttä vastefunktion f(x 1,x 2 ) approksimaationa tarkastellaan tavallisesti testaamalla tarvitaanko mallissa puhdasta kvadraattista kaarevuutta kuvaavia neliöllisiä termejä x 2 1,x 2 2 Heliövaara 12

Keskipisteen lisääminen Kaarevuutta voidaan testata lisäämällä 2 2 -koeasetelmaa + b ab vastaavaan neliöön sen keskipiste CP = (C A,C B ), jossa B (C,C ) A B C A = A + + A 2 (1) a C B = B + + B 2 koodattujen muuttujien arvoissa A + keskipiste on origo (0, 0). Heliövaara 13

Kulmapistehavainnot ja keskipistehavainnot Oletetaan, että kustakin neliön kulmapisteestä on kerätty n havaintoa. Tällöin kulmapistehavaintojen kokonaislukumäärä on 2 2 n = n F (merkintä) Kerätään neliön keskipisteestä n C (> 1) havaintoa. Merkitään mitattuja vastemuuttujan y arvoja z 1,z 2,...,z nc Merkitään kulmapistehavaintojen keskiarvoa ȳ F :llä ja keskipistehavintojen keskiarvoa ȳ C :llä. Heliövaara 14

Kaarevuus Jos kulmapistehavaintojen ja keskipistehavaintojen keskiarvojen erotus ȳ F ȳ C on pieni, ovat keskipistehavainnot lähellä kulmapistehavaintojen määräämää tasoa ja vastefunktion kaarevuus on pientä. Siksi kaarevuuden testaaminen perustetaan erotuksen neliöön. ȳ F ȳ C Heliövaara 15

Kaarevuutta kuvaava neliö ja virhettä kuvaava neliösumma Määritellään puhdasta kvadraattista kaarevuutta kuvaava neliö kaavalla SSPQ = n Fn C n F + n C (ȳ F ȳ C ) 2 Määritellään puhdasta virhettä kuvaava neliösumma kaavalla SSPE = 2 2 n (y kij ȳ ij ) 2 + n C (z k ȳ C ) 2 i=1 j=1 k=1 k=1 Heliövaara 16

Testi puhtaalle kvadraattiselle kaarevuudelle Määritellään F -testisuure Jos nollahypoteesi F PQ = (n F + n C 5) SSPQ SSPE H PQ : Ei puhdasta kvadraattista kaarevuutta pätee, niin F PQ F(1,n F + n C 5) Heliövaara 17

Varianssianalyysihajotelma Jos 2 2 -faktorikokeeseen on liitetty keskipiste, pätee varianssianalyysihajotelma SST = SSA + SSB + SSAB + SSPQ + SSPE Keskipistehavaintojen lissäminen on mahdollistanut 2 2 -faktorikokeen tavanomaisen varianssianalyysihajotelman SST = SSA + SSB + SSAB + SSE virhetermin SSE hajottamisen puhdasta kvadraattista kaarevuutta kuvaavaan neliöön ja puhdasta virhettä kuvaavaan neliösummaan: SSE = SSPQ + SSPE Heliövaara 18

Varianssianalyysitaulukko Varianssianalyysitaulukko 2 2 -faktorikokeelle, johon on lisätty keskipiste: Vaihtelun lähde SS df M S F A SSA 1 MSA = SSA/df F A = MSA/MSPE B SSB 1 MSB = SSB/df F B = MSB/MSPE AB SSAB 1 MSAB = SSAB/df F AB = MSAB/MSPE PQ SSPQ 1 MSPQ = SSPQ/df F P Q = MSPQ/MSPE PE SSPE n F + n C 5 MSPE = SSPE/df E SSE n F + n C 4 MSE = SSE/df T SST n F + n C 1 Heliövaara 19

Vastefunktion optimin etsiminen ja gradienttimenetelmä Heliövaara 20

Vastepinnan gradientti Ensimmäisen asteen vastepinta ŷ = b 0 + b 1 x 1 + b 2 x 2 + b 12 x 1 x 2 kasvaa voimakkaimmin sen gradientin suuntaan. Keskipisteessä CP, eli x 1 x 2 -koordinaatiston origossa vastepinnan gradientti on muotoa b = [b 1,b 2 ] T Heliövaara 21

Gradienttimenetelmä Gradienttimenetelmässä poimitaan uusia havaintoja nillä tekijöiden A ja B tasoilla, jotka määräytyvät liikkumalla keskipisteestä CP tasaisin askelin gradientin b suuntaan (maksimoitaessa), tai sitä vastaan (minimoitaessa). Uusia havaintoja poimitaan, kunnes vasteen arvo ei enää parane. Heliövaara 22

Askelpituuksien määrääminen Askeleet, joilla siirtyminen vektorin b (tai b) suuntaan tapahtuu, voidaan määrätä seuraavasti: (i) Valitaan vasteeseen vaikuttavista faktoreista tärkeämpi (oletetaan että tärkeämmäksi valitaan faktori B). Olkoon x 2 tärkeämpää faktoria B vastaava koodattu muuttuja. Valitaan tärkeämmälle muuttujalle x 2 askelpituudeksi x 2. (ii) Valitaan muuttujalle x 1 askelpituus kaavalla x 1 = b 1 b 2 x 2 (iii) Konvertoidaan askelpituudet koodattujen muuttujien arvoista luonnollisten muuttujien arvoiksi kaavalla X = x X + X 2 Heliövaara 23

Varianssianalyysin kertaus Heliövaara 24

Yksisuuntainen varianssianalyysi Vaihtelun lähde SS df M S F Ryhmien välinen SSG k 1 MSG = SSG/df F = MSG/MSE Ryhmien sisäinen SSE N k MSE = SSE/df Kokonaisvaihtelu SST N 1 SST = kx n i X i=1 j=1 y 2 ji 1 N T2 SSG = kx i=1 1 n i T 2 i 1 N T2 SSE = SST SSG Heliövaara 25

Kaksisuuntainen varianssianalyysi Vaihtelun lähde SS df M S F A SSA I 1 MSA = SSA/df F A = MSA/MSE B SSB J 1 MSB = SSB/df F B = MSB/MSE AB SSAB (I 1)(J 1) MSAB = SSAB/df F AB = MSAB/MSE Jäännösvaihtelu SSE IJ(K 1) M SE = SSE/df Kokonaisvaihtelu SST IJK 1 SST = IX JX KX i=1 j=1 k=1 y 2 kij 1 IJK T2 SS = 1 K IX JX i=1 j=1 T 2 ij 1 IJK T2 SSA = 1 JK SSB = 1 IK IX i=1 JX j=1 T 2 i 1 IJK T2 T 2 j 1 IJK T2 SSAB = SS SSA SSB SSE = SST SS Heliövaara 26

Satunnaistettu täydellinen lohkoasetelma Vaihtelun lähde SS df M S F A SSA I 1 MSA = SSA/df F A = MSA/MSE B SSB J 1 MSB = SSB/df Jäännösvaihtelu SSE (I 1)(J 1) M SE = SSE/df Kokonaisvaihtelu SST IJ 1 SST = IX JX i=1 j=1 yij 2 1 IJ T2 SSA = 1 J SSB = 1 I IX i=1 JX j=1 Ti 2 1 IJ T2 T j 2 1 IJ T2 SSE = SST SSA SSB Heliövaara 27

Latinalaisten neliöiden koeasetelma Vaihtelun lähde SS df M S F A SSA P 1 MSA = SSA/df F A = MSA/MSE R SSR P 1 MSR = SSR/df C SSC P 1 MSC = SSC/df Jäännösvaihtelu SSE (P 2)(P 1) M SE = SSE/df Kokonaisvaihtelu SST P 2 1 SST = PX PX PX i=1 j=1 k=1 y 2 ijk 1 P 2 T2 SSC = 1 P PX j=1 T 2 j 1 P 2 T2 SSR = 1 P PX i=1 T 2 i 1 P 2 T2 SSA = 1 P PX k=1 T 2 k 1 P 2 T2 SSE = SST SSA SSR SSC Heliövaara 28

Kaksiasteinen hierarkkinen koeasetelma Tapaus 1: A kiinteä ja B kiinteä Vaihtelun lähde SS df M S F A SSA I 1 MSA = SSA/df F A = MSA/MSE B(A) SSB(A) I(J 1) MSB(A) = SSB(A)/df F B(A) = MSB(A)/MSE Jäännösvaihtelu SSE IJ(K 1) M SE = SSE/df Kokonaisvaihtelu SST IJK 1 SST = IX JX KX i=1 j=1 k=1 y 2 kij 1 IJK T2 SSB(A) = 1 K IX JX i=1 j=1 T 2 ij 1 JK T2 i SSA = 1 JK IX i=1 T 2 i 1 IJK T2 SSE = SST SSA SSB(A) Heliövaara 29

Kaksiasteinen hierarkkinen koeasetelma Tapaus 2: A kiinteä ja B satunnainen Vaihtelun lähde SS df M S F A SSA I 1 MSA = SSA/df F A = MSA/MSB(A) B(A) SSB(A) I(J 1) MSB(A) = SSB(A)/df F B(A) = MSB(A)/MSE Jäännösvaihtelu SSE IJ(K 1) M SE = SSE/df Kokonaisvaihtelu SST IJK 1 SST = IX JX KX i=1 j=1 k=1 y 2 kij 1 IJK T2 SSB(A) = 1 K IX JX i=1 j=1 T 2 ij 1 JK T2 i SSA = 1 JK IX i=1 T 2 i 1 IJK T2 SSE = SST SSA SSB(A) Heliövaara 30

Kaksiasteinen hierarkkinen koeasetelma Tapaus 3: A satunnainen ja B satunnainen Samoin kuin tapauksessa 2. Heliövaara 31

2 2 faktorikokeet - 2 2 faktorikoe on kaksisuuntaisen varianssianalyysin erikoistapaus, jossa I = 2 ja J = 2. Vaihtelun lähde SS df M S F A SSA 1 MSA = SSA/df F A = MSA/MSE B SSB 1 MSB = SSB/df F B = MSB/MSE AB SSAB 1 MSAB = SSAB/df F AB = MSAB/MSE Jäännösvaihtelu SSE 4(n 1) M SE = SSE/df Kokonaisvaihtelu SST 4n 1 SSA = 1 [ab + a b (1)]2 4n SSB = 1 [ab a + b (1)]2 4n SSAB = 1 [ab a b + (1)]2 4n SST = IX JX KX i=1 j=1 k=1 y 2 kij 1 IJK T2 SSE = SST SSA SSB SSAB Heliövaara 32

Sir Ronald A. Fisher Kehitti suurimman uskottavuuden menetelmän, varianssianalyysin ja paljon muuta.. Heliövaara 33