Vastepintamenetelmä Kurssipalautteen antamisesta saa hyvityksenä yhden tenttipisteen. Palautelomakkeeseen tulee lähiaikoina linkki kurssin kotisivuille. Heliövaara 1
Vastepintamenetelmä Vastepintamenetelmässä pyritään vasteen riippuvuutta siihen vaikuttavista tekijöistä approksimoimaan tekijöiden polynomimuotoisella funktiolla, jota kutsutaan vastepintamalliksi. Polynomimuotoisten vastepintamallien avulla on helppo etsiä vasteeseen vaikuttavien tekijöiden optimaalista kombinaatiota. Vastepintamenetelmä on vaiheittain etenevä mallinrakentamisstrategia, jonka aikana joudutaan tavallisesti keräämään myös uusia havaintoja. Heliövaara 2
Vastepintamenetelmä Oletetaan, että vastemuuttujan y havaittujen arvojen riippuvuutta tekijöiden x 1,x 2,...,x k tasoista voidaan kuvata funktiolla y = f(x 1,x 2,...,x k ) + ε jossa jäännöstermi ε edustaa satunnaisvirhettä muuttujan y havaituissa arvoissa. Vastepintamenetelmän tavoitteena on löytää sellainen tekijöiden x 1,x 2,...,x k tasojen kombinaatio, joka optimoi (minimoi tai maksimoi) vastefunktion arvon. f(x 1,x 2,...,x k ) Heliövaara 3
Vastepintamenetelmä Funktion f muoto on tavallisesti tuntematon ja siksi funktiota pyritään approksimoimaan sopivasti valitulla faktoreiden polynomilla. Tällöin on tärkeää selvittää riittäkö funktiolle f lineaarinen approksimaatio vai tarvitaanko jotakin korkeampiasteista approksimaatiota. Tällä kurssilla tarkastelemme vastepintamenetelmää 2 2 -faktorikokeiden yhteydessä. Heliövaara 4
Vastepintamenetelmä 2 2 -faktorikokeissa Heliövaara 5
Luonnolliset muuttujat Kutsumme tekijöitä A ja B luonnollisiksi muuttujiksi, jos niiden arvot on annettu tekijöiden oikeissa, luonnollisissa mittayksiköissä. Olkoon X + =Tekijän X arvo, kun tekijän X taso on korkea (+) X jossa =Tekijän X arvo, kun tekijän X taso on matala ( ) X = A,B Heliövaara 6
Koodatut muuttujat Olkoon x = X (X + + X )/2 (X + X )/2 luonnollista muuttujaa X vastaava koodattu muuttuja. Tällöin x = +1, jos X = X + 1, jos X = X Kääntäen, luonnollisen muuttujan X arvot saadaan koodatun muuttujan x arvoista kaavalla X = 1 2 (X + X )x + 1 2 (X + + X ) Heliövaara 7
1. asteen lineaarinen vastepintamalli Määritellään 1. asteen lineaarinen vastepintamalli kaavalla jossa y = β 0 + β 1 x 1 + β 2 x 2 + ε x 1 x 2 =Tekijää A vastaava koodattu muuttuja =Tekijää B vastaava koodattu muuttuja Mallin avulla voidaan mallintaa tekijöiden A ja B päävaikutukset. Malli ei kykene huomioimaan vastefunktion f mahdollista kaarevuutta. Heliövaara 8
1. asteen vastepintamalli 1/2 Lisäämällä 1. asteen lineaariseen vastepintamalliin koodattujen muuttujien x 1 ja x 2 tulotermi, joka kuvaa tekijöiden A ja B yhteisvaikutusta, saadaan 1. asteen vastepintamalli y = β 0 + β 1 x 1 + β 2 x 2 + β 12 x 1 x 2 + ε Mallin avulla voidaan mallintaa tekijöiden A ja B päävaikutukset ja yhdysvaikutus eli interaktio. Malli kykenee jonkin verran huomioimaan vastefunktion f mahdollista kaarevuutta. Heliövaara 9
1. asteen vastepintamalli 2/2 Vastepintamallit ovat parametrien suhteen tavanomaisia lineaarisia regressiomalleja, joiden parametrit voidaan estimoida pienimmän neliösumman menetelmällä. 1. asteen vastepintamallin parametrien β 0,β 1,β 2,β 12 PNS-estimaattorit ovat b 0 = ȳ b 2 = X B /2 b 1 = X A /2 b 12 = X AB /2 Estimoitu 1. asteen vastepinnan yhtälö on siis muotoa ŷ = ȳ + ( XA 2 ) x 1 + ( XB 2 ) x 2 + ( XAB 2 ) x 1 x 2 Heliövaara 10
Vastefunktion kaarevuuden testaaminen Heliövaara 11
Kvadraattisen kaarevuuden testaaminen 2 2 -koeasetelmassa sovellettavan 1. asteen vastepintamallin y = β 0 + β 1 x 1 + β 2 x 2 + β 12 x 1 x 2 + ε riittävyyttä vastefunktion f(x 1,x 2 ) approksimaationa tarkastellaan tavallisesti testaamalla tarvitaanko mallissa puhdasta kvadraattista kaarevuutta kuvaavia neliöllisiä termejä x 2 1,x 2 2 Heliövaara 12
Keskipisteen lisääminen Kaarevuutta voidaan testata lisäämällä 2 2 -koeasetelmaa + b ab vastaavaan neliöön sen keskipiste CP = (C A,C B ), jossa B (C,C ) A B C A = A + + A 2 (1) a C B = B + + B 2 koodattujen muuttujien arvoissa A + keskipiste on origo (0, 0). Heliövaara 13
Kulmapistehavainnot ja keskipistehavainnot Oletetaan, että kustakin neliön kulmapisteestä on kerätty n havaintoa. Tällöin kulmapistehavaintojen kokonaislukumäärä on 2 2 n = n F (merkintä) Kerätään neliön keskipisteestä n C (> 1) havaintoa. Merkitään mitattuja vastemuuttujan y arvoja z 1,z 2,...,z nc Merkitään kulmapistehavaintojen keskiarvoa ȳ F :llä ja keskipistehavintojen keskiarvoa ȳ C :llä. Heliövaara 14
Kaarevuus Jos kulmapistehavaintojen ja keskipistehavaintojen keskiarvojen erotus ȳ F ȳ C on pieni, ovat keskipistehavainnot lähellä kulmapistehavaintojen määräämää tasoa ja vastefunktion kaarevuus on pientä. Siksi kaarevuuden testaaminen perustetaan erotuksen neliöön. ȳ F ȳ C Heliövaara 15
Kaarevuutta kuvaava neliö ja virhettä kuvaava neliösumma Määritellään puhdasta kvadraattista kaarevuutta kuvaava neliö kaavalla SSPQ = n Fn C n F + n C (ȳ F ȳ C ) 2 Määritellään puhdasta virhettä kuvaava neliösumma kaavalla SSPE = 2 2 n (y kij ȳ ij ) 2 + n C (z k ȳ C ) 2 i=1 j=1 k=1 k=1 Heliövaara 16
Testi puhtaalle kvadraattiselle kaarevuudelle Määritellään F -testisuure Jos nollahypoteesi F PQ = (n F + n C 5) SSPQ SSPE H PQ : Ei puhdasta kvadraattista kaarevuutta pätee, niin F PQ F(1,n F + n C 5) Heliövaara 17
Varianssianalyysihajotelma Jos 2 2 -faktorikokeeseen on liitetty keskipiste, pätee varianssianalyysihajotelma SST = SSA + SSB + SSAB + SSPQ + SSPE Keskipistehavaintojen lissäminen on mahdollistanut 2 2 -faktorikokeen tavanomaisen varianssianalyysihajotelman SST = SSA + SSB + SSAB + SSE virhetermin SSE hajottamisen puhdasta kvadraattista kaarevuutta kuvaavaan neliöön ja puhdasta virhettä kuvaavaan neliösummaan: SSE = SSPQ + SSPE Heliövaara 18
Varianssianalyysitaulukko Varianssianalyysitaulukko 2 2 -faktorikokeelle, johon on lisätty keskipiste: Vaihtelun lähde SS df M S F A SSA 1 MSA = SSA/df F A = MSA/MSPE B SSB 1 MSB = SSB/df F B = MSB/MSPE AB SSAB 1 MSAB = SSAB/df F AB = MSAB/MSPE PQ SSPQ 1 MSPQ = SSPQ/df F P Q = MSPQ/MSPE PE SSPE n F + n C 5 MSPE = SSPE/df E SSE n F + n C 4 MSE = SSE/df T SST n F + n C 1 Heliövaara 19
Vastefunktion optimin etsiminen ja gradienttimenetelmä Heliövaara 20
Vastepinnan gradientti Ensimmäisen asteen vastepinta ŷ = b 0 + b 1 x 1 + b 2 x 2 + b 12 x 1 x 2 kasvaa voimakkaimmin sen gradientin suuntaan. Keskipisteessä CP, eli x 1 x 2 -koordinaatiston origossa vastepinnan gradientti on muotoa b = [b 1,b 2 ] T Heliövaara 21
Gradienttimenetelmä Gradienttimenetelmässä poimitaan uusia havaintoja nillä tekijöiden A ja B tasoilla, jotka määräytyvät liikkumalla keskipisteestä CP tasaisin askelin gradientin b suuntaan (maksimoitaessa), tai sitä vastaan (minimoitaessa). Uusia havaintoja poimitaan, kunnes vasteen arvo ei enää parane. Heliövaara 22
Askelpituuksien määrääminen Askeleet, joilla siirtyminen vektorin b (tai b) suuntaan tapahtuu, voidaan määrätä seuraavasti: (i) Valitaan vasteeseen vaikuttavista faktoreista tärkeämpi (oletetaan että tärkeämmäksi valitaan faktori B). Olkoon x 2 tärkeämpää faktoria B vastaava koodattu muuttuja. Valitaan tärkeämmälle muuttujalle x 2 askelpituudeksi x 2. (ii) Valitaan muuttujalle x 1 askelpituus kaavalla x 1 = b 1 b 2 x 2 (iii) Konvertoidaan askelpituudet koodattujen muuttujien arvoista luonnollisten muuttujien arvoiksi kaavalla X = x X + X 2 Heliövaara 23
Varianssianalyysin kertaus Heliövaara 24
Yksisuuntainen varianssianalyysi Vaihtelun lähde SS df M S F Ryhmien välinen SSG k 1 MSG = SSG/df F = MSG/MSE Ryhmien sisäinen SSE N k MSE = SSE/df Kokonaisvaihtelu SST N 1 SST = kx n i X i=1 j=1 y 2 ji 1 N T2 SSG = kx i=1 1 n i T 2 i 1 N T2 SSE = SST SSG Heliövaara 25
Kaksisuuntainen varianssianalyysi Vaihtelun lähde SS df M S F A SSA I 1 MSA = SSA/df F A = MSA/MSE B SSB J 1 MSB = SSB/df F B = MSB/MSE AB SSAB (I 1)(J 1) MSAB = SSAB/df F AB = MSAB/MSE Jäännösvaihtelu SSE IJ(K 1) M SE = SSE/df Kokonaisvaihtelu SST IJK 1 SST = IX JX KX i=1 j=1 k=1 y 2 kij 1 IJK T2 SS = 1 K IX JX i=1 j=1 T 2 ij 1 IJK T2 SSA = 1 JK SSB = 1 IK IX i=1 JX j=1 T 2 i 1 IJK T2 T 2 j 1 IJK T2 SSAB = SS SSA SSB SSE = SST SS Heliövaara 26
Satunnaistettu täydellinen lohkoasetelma Vaihtelun lähde SS df M S F A SSA I 1 MSA = SSA/df F A = MSA/MSE B SSB J 1 MSB = SSB/df Jäännösvaihtelu SSE (I 1)(J 1) M SE = SSE/df Kokonaisvaihtelu SST IJ 1 SST = IX JX i=1 j=1 yij 2 1 IJ T2 SSA = 1 J SSB = 1 I IX i=1 JX j=1 Ti 2 1 IJ T2 T j 2 1 IJ T2 SSE = SST SSA SSB Heliövaara 27
Latinalaisten neliöiden koeasetelma Vaihtelun lähde SS df M S F A SSA P 1 MSA = SSA/df F A = MSA/MSE R SSR P 1 MSR = SSR/df C SSC P 1 MSC = SSC/df Jäännösvaihtelu SSE (P 2)(P 1) M SE = SSE/df Kokonaisvaihtelu SST P 2 1 SST = PX PX PX i=1 j=1 k=1 y 2 ijk 1 P 2 T2 SSC = 1 P PX j=1 T 2 j 1 P 2 T2 SSR = 1 P PX i=1 T 2 i 1 P 2 T2 SSA = 1 P PX k=1 T 2 k 1 P 2 T2 SSE = SST SSA SSR SSC Heliövaara 28
Kaksiasteinen hierarkkinen koeasetelma Tapaus 1: A kiinteä ja B kiinteä Vaihtelun lähde SS df M S F A SSA I 1 MSA = SSA/df F A = MSA/MSE B(A) SSB(A) I(J 1) MSB(A) = SSB(A)/df F B(A) = MSB(A)/MSE Jäännösvaihtelu SSE IJ(K 1) M SE = SSE/df Kokonaisvaihtelu SST IJK 1 SST = IX JX KX i=1 j=1 k=1 y 2 kij 1 IJK T2 SSB(A) = 1 K IX JX i=1 j=1 T 2 ij 1 JK T2 i SSA = 1 JK IX i=1 T 2 i 1 IJK T2 SSE = SST SSA SSB(A) Heliövaara 29
Kaksiasteinen hierarkkinen koeasetelma Tapaus 2: A kiinteä ja B satunnainen Vaihtelun lähde SS df M S F A SSA I 1 MSA = SSA/df F A = MSA/MSB(A) B(A) SSB(A) I(J 1) MSB(A) = SSB(A)/df F B(A) = MSB(A)/MSE Jäännösvaihtelu SSE IJ(K 1) M SE = SSE/df Kokonaisvaihtelu SST IJK 1 SST = IX JX KX i=1 j=1 k=1 y 2 kij 1 IJK T2 SSB(A) = 1 K IX JX i=1 j=1 T 2 ij 1 JK T2 i SSA = 1 JK IX i=1 T 2 i 1 IJK T2 SSE = SST SSA SSB(A) Heliövaara 30
Kaksiasteinen hierarkkinen koeasetelma Tapaus 3: A satunnainen ja B satunnainen Samoin kuin tapauksessa 2. Heliövaara 31
2 2 faktorikokeet - 2 2 faktorikoe on kaksisuuntaisen varianssianalyysin erikoistapaus, jossa I = 2 ja J = 2. Vaihtelun lähde SS df M S F A SSA 1 MSA = SSA/df F A = MSA/MSE B SSB 1 MSB = SSB/df F B = MSB/MSE AB SSAB 1 MSAB = SSAB/df F AB = MSAB/MSE Jäännösvaihtelu SSE 4(n 1) M SE = SSE/df Kokonaisvaihtelu SST 4n 1 SSA = 1 [ab + a b (1)]2 4n SSB = 1 [ab a + b (1)]2 4n SSAB = 1 [ab a b + (1)]2 4n SST = IX JX KX i=1 j=1 k=1 y 2 kij 1 IJK T2 SSE = SST SSA SSB SSAB Heliövaara 32
Sir Ronald A. Fisher Kehitti suurimman uskottavuuden menetelmän, varianssianalyysin ja paljon muuta.. Heliövaara 33