Toimittaja Erä

Save this PDF as:
 WORD  PNG  TXT  JPG

Koko: px
Aloita esitys sivulta:

Download "Toimittaja 1 2 3 Erä 1 2 3 4 1 2 3 4 1 2 3 4 1 2 2 1 1 0 1 0 2 2 1 3 1 3 0 4 2 4 0 3 4 0 1 2 0 4 1 0 3 2 2 2 0 2 2 1"

Transkriptio

1 Mat-.03 Koesuunnittelu ja tilastolliset mallit / Ratkaisut Aiheet: Avainsanat: Hierarkkiset koeasetelmat -faktorikokeet Vastepintamenetelmä Aritmeettinen keskiarvo, Estimaatti, Estimaattori, -testi, aktorikokeet, Gradienttimenetelmä, Hierarkkiset koeasetelmat, Interaktio, Jäännösneliösumma, Kaarevuus, Kaksisuuntainen varianssianalyysi, Keskiarvo-diagrammi, Kokonaisvaihtelu, Kolmisuuntainen varianssianalyysi, Kvantitatiivinen muuttuja, Optimointi, Päävaikutus, Reunakeskiarvo, Ryhmien sisäinen vaihtelu, Ryhmien välinen vaihtelu, Ryhmä, Ryhmäkeskiarvo, Vapausaste, Varianssi, Varianssianalyysi, Varianssianalyysihajotelma, Vastepinta, Vastepintamenetelmät, Yhteisvaihtelu, Yleiskeskiarvo 0.. Tehdas ostaa tarvitsemaansa raaka-ainetta erinä kolmelta raaka-aineen toimittajalta. Raakaaineen puhtaus vaihtelee jonkin verran, mikä aiheuttaa tehtaan tuotantoprosessissa ongelmia. Tehdas haluaa selvittää onko eri toimittajilta ostettujen raaka-aineiden keskimääräisissä puhtauksissa systemaattista eroa. Tätä varten jokaisen raaka-aineen toimittajan toimittamista raaka-aine-eristä valittiin satunnaisesti 4 erää tutkittavaksi ja jokaisesta erästä tutkittiin kolme näytettä. Tulokset on annettu alla olevassa taulukossa (yksikkö: puhtaus % 93). Puhtaus % 93 Toimittaja 3 Erä Teoriaa: Tutki onko raaka-aineen toimittajien toimittamien erien keskimääräisessä puhtaudessa eroa. Tehtävän koeasetelmana on kaksiasteinen hierarkkinen koeasetelma. Oletetaan, että kokeen tavoitteena on tutkia, miten käsittelyt ja A, A,, A I B (i), B (i),, B J(i), i =,,, I vaikuttavat kiinnostuksen kohteena olevan vastemuuttujan y keskimääräisiin arvoihin tilanteessa, jossa käsittelyt B j(), B j(),, B j(i ) ovat samankaltaisia, mutta eivät identtisiä käsittelyille A, A,, A I, j =,,, J. Tällöin sanomme, että koeasetelma on hierarkkinen ja käsittelyt B (i), B (i),, B J(i) ovat alisteisia käsittelylle A i, i =,,, I. Ilkka Mellin (005) /84

2 Kaksiasteista hierarkkista koeasetelmaa voidaan kuvata alla olevalla kaaviolla: A A A I B () B () B J() B () B () B J() B (I) B J(I) B (I) Kaksiasteisen hierarkkisen koeasetelman tilastollinen malli ja sen parametrointi Kaksiasteisen hierarkkisen koeasetelman tilastollinen malli on tässä seuraavaa muotoa: y kij = µ + α i + β j () i + ε( ij ) k k =,,, K, i =,,, I, j =,,, J jossa jäännöstermi ε ( ij) k N(0, σ ) k =,,, K, i =,,, I, j =,,, J Koska tehtävän tapauksessa tekijä A on kiinteä ja tekijä B on satunnainen, oletamme, että I i= β α = 0, i =,,, I ji () i N(0, σ ), i =,,, I, j =,,, J β Kaksiasteisen hierarkkisen koeasetelman nollahypoteesit Käsittelyiden vaikutusta koskevat nollahypoteesit ovat muotoa ja H A : Ei A-vaikutusta H B(A) : Ei B-vaikutusta tekijän A sisällä Koska tehtävän tapauksessa tekijää A voidaan pitää tässä kiinteänä ja tekijää B satunnaisena, Nollahypoteesit H A ja H B(A) voidaan ilmaista mallin parametrien avulla seuraavissa muodoissa: H A : α = α = = α I = 0 H B(A) : σ = 0 β Ilkka Mellin (005) /84

3 Keskiarvot Havaintoarvojen y kij ryhmäkeskiarvo ryhmässä j(i), jossa tekijän B taso j on alisteinen tekijän A tasolle i: K yi = y, i =,,, I, j =,,, J ij K k = kij Havaintoarvojen y kij reunakeskiarvo kaikista havainnoista, jotka ovat alisteisia tekijän A tasolle i: J K J y = y = y, i =,,, I ii i i kij ij JK j= k= J j= Jos havainnot yhdistetään yhdeksi otokseksi, yhdistetyn otoksen havaintoarvojen yleis- eli kokonaiskeskiarvo on jossa I J K I J I y = y = y = iii kij iij iii IJK i= j= k= IJ i= j= I i= IJK = N on yhdistetyn otoksen havaintojen kokonaislukumäärä. y Varianssianalyysihajotelma Testit hypoteeseille H A ja H B(A) perustuvat varianssianssianalyysihajotelmaan SST = SSA + SSB(A) + SSE Neliösumma I J K kij iii ) y i= j= k= SST = ( y y ) = ( IJK s kuvaa havaintoarvojen kokonaisvaihtelua. Neliösumma I J K I ( iii iii) ( iii iii) i= j= k= i= SSA= y y = JK y y kuvaa tekijän A osuutta havaintojen kokonaisvaihtelusta. Neliösumma I J K I J iij iii iij iii i= j= k= i= j= SSB( A) = ( y y ) = K ( y y ) kuvaa tekijän B vaikutusta tekijän A sisällä. Ilkka Mellin (005) 3/84

4 Neliösumma (jäännösneliösumma) I J K I J ( kij i ij ) ( ) ij i= j= k= i= j= SSE = y y = K s kuvaa havaintojen kokonaisvaihtelua tekijän B tasojen muodostamien ryhmien sisällä. Testisuureet Määritellään -testisuure A I( J ) SSA = I SSB( A) jossa SSA on tekijän A vaikutusta kuvaava neliösumma ja SSB(A) on tekijän B vaikutusta tekijän A sisällä kuvaava neliösumma. Jos nollahypoteesi pätee, niin H A : Ei A-vaikutusta (( I ), I( J )) A Suuret testisuureen A arvot johtavat nollahypoteesin hylkäämiseen. Määritellään -testisuure B( A) IJ ( K ) SSB( A) = I( J ) SSE jossa SSB(A) on tekijän B vaikutusta tekijän A sisällä kuvaava neliösumma ja SSE on jäännösneliösumma. Jos nollahypoteesi pätee, niin H B(A) : Ei B-vaikutusta tekijän A sisällä B( A) ( I( J ), IJ( K )) Suuret testisuureen B(A) arvot johtavat nollahypoteesin hylkäämiseen. Huomautus: Testisuureet ja niiden jakaumat perustuvat oletukseen, että tekijä A on kiinteä, mutta tekijä B on satunnainen. Ilkka Mellin (005) 4/84

5 Hierarkkisen varianssianalyysin testien tulokset ilmaistaan tavallisesti varianssianalyysitaulukon muodossa: Vaihtelun lähde Neliösumma SS Vapausasteet df A SSA I B(A) SSB(A) I(J ) Varianssiestimaattori MS -testisuure SSA MSA MSA = = I MSB ( A ) SSB( A) MSB( A) = I( J ) = MSB( A) MSE Jäännös SSE IJ(K ) MSE = SSE IJ ( K ) Kokonaisvaihtelu SST IJK Varianssianssianalyysitaulukon neliösummat toteuttavat varianssianssianalyysihajotelmaan SST = SSA + SSB(A) + SSE ja neliösummiin liittyvät vapausasteet toteuttavat vastaavan yhtälön IJK = (I ) + I(J ) + IJ(K ) Kaksiasteisen hierarkkisen koeasetelma ja kaksisuuntainen varianssianalyysi Jos tekijöiden A ja B vaikutusta vastemuuttujaan y käsitellään (virheellisesti) samalla tavalla kuten kaksisuuntaisessa varianssianalyysissa, niin saadaan varianssianalyysihajotelma SST = SSA + SSB + SSAB + SSE Neliösummat SST, SSA ja SSE ovat täsmälleen samat kuin hierarkkisessa kaksiasteisessa varianssianalyysissa. Lisäksi pätee jossa SSB(A) = SSB + SSAB I J K J ( ii j iii) ( ii j iii) i= j= k= j= SSB = y y = IK y y on tekijän B (pää-) vaikutusta kuvaava neliösumma ja I J K J K ( iij iii ii j iii) ( iij iii ii j + iii) i= j= k= j= k= SSAB = y y y + y = K y y y y on tekijöiden A ja B interaktiota eli yhdysvaikutusta kuvaava neliösumma. Ilkka Mellin (005) 5/84

6 Näissä kaavoissa I K I y = y = y, j =,,, J ii i j kij ij IK i= k= I i= Neliösummiin SSB(A), SSB ja SSAB liittyvät vapausasteet toteuttavat yhtälön I(J ) = (J ) + (I )(J ) Laskutoimitusten järjestely Jos varianssianalyysihajotelman neliösummat SST, SSA, SSB(A), SSE joudutaan laskemaan käsin tai laskimella, kannattaa laskutoimituksissa käyttää alla esitettäviä kaavoja. Määritellään seuraavat summat: T iij = K k = y kij J K J T = y = T ii i kij iij j= k= j= I J K I J I T = y = T = iii kij iij iii i= j= k= i= j= i= i =,,, I, j =,,, J Tällöin yllä määritellyt keskiarvot saadaan kaavoilla y y y iij ii i iii = Tiij K = Tii i JK = Tiii IJK i =,,, I, j =,,, J Havaintoarvojen kokonaisvaihtelua kuvaava neliösumma voidaan laskea kaavalla SST = y y = y T IJK I J K I J K ( kij iii) kij i= j= k= i= j= k= Tekijän A vaikutusta kuvaava neliösumma voidaan laskea kaavalla SSA = JK y y = T T I I ( iii iii) iii iii i= JK i= IJK Tekijän B vaikutusta tekijän A sisällä kuvaava neliösumma voidaan laskea kaavalla SSB( A) = K ( y y ) == T T Jäännösneliösumma saadaan kaavalla T I J I J I iij iii iij iii i= j= K i= j= JK i= SSE = SST SSA SSB(A) iii Ilkka Mellin (005) 6/84

7 Käsin tai laskimella laskettaessa laskutoimitukset kannattaa järjestää seuraavan taulukon muotoon: A A $ AI B B $ B B B $ B $ B B $ B y y $ y y y $ y $ y y $ y y y $ y y y $ y $ y y $ y % % % % % % % % % yk yk $ ykj yk yk $ ykj $ yki yki $ y T T $ T T T T $ T T $ T T T $ T () () J () () () J() ( I) ( I) J( I) J J I I IJ J J I I IJ i i ij i i ij ii ii iij Summat ii ii ii i K Ti ij = y kij, i =,,, I, j =,,, J k = lasketaan taulukkoon havaintojen sarakesummina. Summat J K J T = y = T, i =,,, I ii i kij i ij j= k= j= lasketaan taulukkoon sarakesummien summina. Havaintojen kokonaissumma saadaan kaavalla Tiii = T I i= iii Lisäksi tarvitaan vain kaikkien havaintojen neliöiden summa I J K i= j= k= y kij KIJ Tehtävän 0.. ratkaisu: Tekijän A tasojen lukumäärä on I = 3 Tekijän B tasojen lukumäärä jokaista tekijän A tasoa kohden on J = 4 Havaintojen lukumäärä jokaisessa tekijän B tason määräämässä ryhmässä on K = 3 Siten havaintojen kokonaislukumäärä on N = IJK = 36 Ilkka Mellin (005) 7/84

8 Neliösummien laskeminen Havaintoarvot on annettu tehtävässä laskutoimitusten kannalta sopivassa taulukkomuodossa. Täydennetään taulukkoa laskemalla siihen sarakesummat K Ti ij = y kij, i =,,, I, j =,,, J k = ja sarakesummien summat: J K J T = y = T, i =,,, I ii i kij i ij j= k= j= y kij A i 3 B j(i) T ij T i Havaintojen kokonaissumma on I T = T = = 3 iii i= iii Havaintoarvojen neliöiden kokonaissumma on I J K i= j= k= y kij = 53 Havaintojen kokonaisvaihtelua kuvaava neliösumma on Taulukosta saadaan I J K Tiii 3 SST = ykij = 53 = N 36 I Tii i i= i= j= k= = 37 joten tekijän A vaikutusta kuvaava neliösumma on I Tiii 3 SSA = Tii i = 37 = JK N i= Ilkka Mellin (005) 8/84

9 Taulukosta saadaan I J Ti i= j= ij = 69 joten tekijän B vaikutusta tekijän A sisällä kuvaava neliösumma on SSB A y T I J I ( ) = iij iii = = K i= j= JK i= Varianssianalyysihajotelmasta saadaan jäännösneliösummaksi SSE = SST SSA SSB(A) = = testisuureiden laskeminen Testisuureen A arvoiksi saadaan: A I( J ) SSA 3 (4 ) = = = I SSB( A) Jos nollahypoteesi H A : Ei A-vaikutusta pätee A ((I ), I(J )) = (, 9) Testisuureen B(A) arvoiksi saadaan: B( A) IJ ( K ) SSB( A) 3 4 (3 ) = = =.944 I( J ) SSE 3 (4 ) Jos nollahypoteesi H B(A) : Ei B-vaikutusta tekijän A sisällä pätee B(A) (I(J ), IJ(K )) = (9, 4) Testien tekeminen Olkoon nollahypoteesina H A : Ei A-vaikutusta Testisuureen arvoksi saatiin A = Testisuureen arvoa vastaavaksi p-arvoksi saadaan esimerkiksi Excel-ohjelmalla Pr( 0.969) = 0.46 Ilkka Mellin (005) 9/84

10 Siten nollahypoteesia H A ei voida hylätä merkitsevyystasolla Taulukoiden mukaan jossa Koska Pr( 4.56) = 0.05 ((I ), I(J )) = (, 9) 4.56 > = A voimme todeta (kuten edellä), että nollahypoteesia H A ei voida hylätä merkitsevyystasolla Olkoon nollahypoteesina H B(A) : Ei B-vaikutusta tekijän A sisällä Testisuureen arvoksi saatiin B( A) =.944 Testisuureen arvoa vastaavaksi p-arvoksi saadaan esimerkiksi Excel-ohjelmalla Pr(.944) = 0.07 Siten nollahypoteesi H B(A) voidaan hylätä merkitsevyystasolla 0.05, mutta ei merkitsevyystasolla 0.0. Taulukoiden mukaan jossa Koska Pr(.300) = 0.05 Pr( 3.56) = 0.0 (I(J ), IJ(K )) = (9, 4).300 < = B( A ).944 < 3.56 voimme todeta (kuten edellä), että nollahypoteesi H B(A) voidaan hylätä merkitsevyystasolla 0.05, mutta ei merkitsevyystasolla 0.0. Ilkka Mellin (005) 0/84

11 Testien tulokset voidaan koota seuraavaksi varianssianalyysitaulukoksi: Vaihtelun lähde SS df MS p A B(A) E T Johtopäätös Toimittajalla (tekijä A) ei ole systemaattista vaikutusta raaka-aineen puhtauteen. Sen sijaan toimittajien toimittaman raaka-aineen puhtaus vaihtelee erästä (tekijä B) toiseen. Ilkka Mellin (005) /84

12 Tehtävän 0.. ratkaiseminen tilastollisella ohjelmistolla: Tehtävän aineisto koodattuna Ncss-ohjelmaa varten: Data Report Data List Section Row Purity Supplier Batch Ilkka Mellin (005) /84

13 Ncss-ohjelma antaa seuraavan tulostuksen, kun aineistoon sovelletaan hierarkkista mallia: Analysis of Variance Report Response Purity Expected Mean Squares Section Source Term Denominator Expected Term D ixed? Term Mean Square A: Supplier Yes B(A) S+sB+bsA B(A): Batch 9 No S(AB) S+sB S(AB) 4 No S Analysis of Variance Table Source Sum of Mean Prob Power Term D Squares Square -Ratio Level (Alpha=0.05) A: Supplier B(A): Batch * S Total (Adjusted) Total 36 * Term significant at alpha = 0.05 Means and Standard Error Section Standard Term Count Mean Error All A: Supplier Plots Section 6.00 Means of Purity 3.00 Purity Supplier Bonferroni (All-Pairwise) Multiple Comparison Test Response: Purity Term A: Supplier Alpha=0.050 Error Term=B(A) D=9 MSE= Critical Value= Different Group Count Mean rom Groups Ilkka Mellin (005) 3/84

14 Tehtävän aineisto koodattuna Ncss-ohjelmaa varten, kun aineistoon sovelletaan kaksisuuntaista varianssianalyysia: Data Report Data List Section Row Purity Supplier Batch Ilkka Mellin (005) 4/84

15 Ncss-ohjelma antaa seuraavan tulostuksen, kun aineistoon sovelletaan kaksisuuntaisen varianssianalyysin mallia, jossa tekijä Batch on satunnainen: Analysis of Variance Report Response Purity Expected Mean Squares Section Source Term Denominator Expected Term D ixed? Term Mean Square A: Supplier Yes AB S+sAB+bsA B: Batch 3 No S(AB) S+asB AB 6 No S(AB) S+sAB S(AB) 4 No S Note: Expected Mean Squares are for the balanced cell-frequency case. Analysis of Variance Table Source Sum of Mean Prob Power Term D Squares Square -Ratio Level (Alpha=0.05) A: Supplier B: Batch * AB * S Total (Adjusted) Total 36 * Term significant at alpha = 0.05 Ilkka Mellin (005) 5/84

16 Plots Section Means of Purity Purity Supplier Means of Purity Purity Batch Means of Purity Batch 3 4 Purity Supplier Ilkka Mellin (005) 6/84

17 0.. Valmistettavan yhdisteen saanto riippuu eräässä kemiallisessa prosessissa lähtöaineen konsentraatiosta ja käytettävän katalysaattorin määrästä. Laboratoriossa tutkittiin saantoon vaikuttavien tekijöiden vaikutusta valitsemalla kummallekin tekijälle kaksi tasoa ja tutkimalla saaduilla tasokombinaatioilla kolme näytettä. Tulokset on annettu alla olevassa taulukossa. Saanto Näyte Lähtöaineen konsentraatio Katalysaattorin määrä 3 5 % pauna % pauna % paunaa % paunaa Teoriaa: Tutki millaisia keskimääräisiä vaikutuksia lähtöaineen konsentraatiolla ja katalysaattorin määrällä on valmistettavan yhdisteen saantoon. Tehtävän koeasetelmana on -faktorikoe. Oletetaan, että kokeen tavoitteena on tutkia, miten kaksi faktoria eli tekijää A, B vaikuttavat kiinnostuksen kohteena olevan vastemuuttujan y keskimääräisiin arvoihin, kun kummallekin tekijälle valitaan kokeessa kaksi tasoa: matala ( ) ja korkea (+) -faktorikokeen tilastollinen malli -faktorikoe on kaksisuuntaisen varianssianalyysin tilastollisen mallin erikoistapaus. Koska tekijöillä A ja B on molemmilla kaksi tasoa, havainnot tulevat luokitelluiksi = = 4 ryhmään. -faktorikokeen nollahypoteesit -faktorikokeen nollahypoteesit ovat seuraavaa muotoa: H A : Ei A-vaikutusta H B : Ei B-vaikutusta H AB : Ei yhdysvaikutusta Ilkka Mellin (005) 7/84

18 -faktorikokeen havainnollistus Merkitään käsittelykombinaatioita (, ), (+, ), (,+), (+,+) seuraavalla tavalla: A B Merkintä () + a + b + + ab Oletetaan, että jokaista käsittelykombinaatiota on kokeessa toistettu n kertaa, joten havaintojen kokonaislukumäärä on n= = 4 n Merkitään havaintoarvojen summaa eri käsittelykombinaatioille samalla tavalla kuin vastaavia käsittelykombinaatioita: () = Havaintoarvojen summa, kun A = ( ), B = ( ) a = Havaintoarvojen summa, kun A = (+), B = ( ) b = Havaintoarvojen summa, kun A = ( ), B = (+) ab = Havaintoarvojen summa, kun A = (+), B = (+) -koeasetelmaa voidaan kuvata seuraavalla kaaviolla: + b ab B () + A a -faktorikokeen tekijöiden päävaikutukset ja interaktio eli yhdysvaikutus Yksinkertaisin tapa tekijöiden A ja B päävaikutuksien ja interaktion eli yhdysvaikutuksen laskemiseksi -faktorikokeessa on soveltaa havaintojen summiin eri käsittelykombinaatioille seuraavaa kaavaa: X = ( a± )( b± ) n Ilkka Mellin (005) 8/84

19 jossa n = toistojen lukumäärä ja merkit sulkulausekkeissa määräytyvät seuraavalla tavalla: Merkki =, jos vastaava tekijä on vaikutuksessa mukana Merkki = +, jos vastaava tekijä ei ole vaikutuksessa mukana Lisäksi tulee korvata tulon määräämisen jälkeen merkinnällä (). Tekijän A päävaikutus on X = A ( a )( b ) ( ab a b ()) n + = n + Tekijän B päävaikutus on X = B ( a )( b ) ( ab a b ()) n + = n + Tekijöiden A ja B interaktio eli yhdysvaikutus on X = AB ( a )( b ) ( ab a b ()) n = n + Kaavoista nähdään, että tekijöiden A ja B päävaikutukset ja interaktio eli yhdysvaikutus ovat eri käsittelykombinaatioiden ortogonaalisia kontrasteja. Keskiarvot Olkoon jossa y kij = muuttujan y k. havaintoarvo ryhmässä, jonka määrittelee tekijän A taso i ja tekijän B taso j, k =,,, n, i =,, j =, A = ( ) i = A = (+) i = B = ( ) j = B = (+) j = Ryhmän (i, j) havaintoarvojen aritmeettinen keskiarvo eli ryhmäkeskiarvo on y y, i,, j, n i ij = kij = = n k = Ilkka Mellin (005) 9/84

20 Huomaa, että ryhmäkeskiarvot voidaan ilmaista summien (), a, b, ab avulla: y y y y i i i i = () n = a n = b n = ab n Kaikkien havaintoarvojen aritmeettinen keskiarvo eli yleis- eli kokonaiskeskiarvo on n = kij = ij = ( + + b+ ( iii 4n i= j= k= 4 i i= j= 4n )) y y y ab a Varianssianalyysihajotelma Testit nollahypoteeseille H A, H B ja H AB perustuvat varianssianssianalyysihajotelmaan Neliösumma SST = SSA + SSB + SSAB + SSE n n ( kij iii) kij 4 iii (4 ) y i= j= k= i= j= k= SST = y y = y ny = n s kuvaa havaintoarvojen kokonaisvaihtelua. Koska tekijöiden A ja B päävaikutukset ja interaktio eli yhdysvaikutus ovat eri käsittelykombinaatioita vastaavien havaintojen keskiarvojen ortogonaalisia kontrasteja, niitä vastaavat neliösummat saadaan kaavoilla SSA = nx = ( ab + a b ( )) 4n A SSB = nx = ( ab a + b ( )) 4n B SSAB = nx = ( ab a b + ( )) 4n Neliösumma (jäännösneliösumma) AB n I J ( kij i ij ) ( ) ij i= j= k= i= j= SSE = y y = n s kuvaa havaintojen kokonaisvaihtelua tekijän B tasojen muodostamien ryhmien sisällä. Jäännösneliösumma saadaan tietysti myös laskutoimituksella SSE = SST SSA SSB SSAB Ilkka Mellin (005) 0/84

21 Varianssianalyysihajotelman SST = SSA + SSB + SSAB + SSE neliösummien vapausasteet toteuttavat vastaavan yhtälön 4n = (n ) Testisuureet Määritellään -testisuureet AB A B ( n ) SSAB SSAB = = 4( n ) ( )( ) SSE SSE ( n ) SSA SSA = = 4( n ) ( ) SSE SSE ( n ) SSB SSB = = 4( n ) ( ) SSE SSE Jos nollahypoteesi H AB : Ei yhdysvaikutusta pätee, niin (( )( ), ( n )) = (,4( n )) AB Suuret testisuureen AB arvot johtavat nollahypoteesin H AB hylkäämiseen. Jos nollahypoteesi pätee, niin H A : Ei A-vaikutusta (( ), ( n )) = (, 4( n )) A Suuret testisuureen A arvot johtavat nollahypoteesin H A hylkäämiseen. Jos nollahypoteesi pätee, niin H B : Ei B-vaikutusta (( ), ( n )) = (, 4( n )) B Suuret testisuureen B arvot johtavat nollahypoteesin H B hylkäämiseen. Ilkka Mellin (005) /84

22 -kokeen testien tulokset ilmaistaan tavallisesti varianssianalyysitaulukon muodossa: Vaihtelun lähde Neliösumma SS Vapausasteet df Varianssiestimaattori MS -testisuure A SSA MSA = SSA = MSA MSE B SSB MSB = SSB = MSB MSE AB SSAB MSAB = SSAB = MSAB MSE Jäännös SSE 4(n ) SSE MSE = 4( n ) Kokonaisvaihtelu SST 4n Varianssianalyysitaulukon neliösummat toteuttavat varianssianalyysihajotelman SST = SSA + SSB + SSAB + SSE ja neliösummiin liittyvät vapausasteet toteuttavat vastaavan yhtälön 4n = (n ). asteen vastepintamalli Siirrytään luonnollisista tekijöiden A ja B mittayksiköistä koodattuihin muuttujan arvoihin yhtälöllä X ( X+ + X )/ x =, X = X, X ( X X )/ + Koodatun muuttujan x arvot ovat +, jos X = X x =, jos X = X + + Määritellään vastemuuttujalle y. asteen vastepintamalli jossa y = β + β x + β x + β x x +ε 0 x = Tekijää A vastaava koodattu muuttuja x = Tekijää B vastaava koodattu muuttuja Ilkka Mellin (005) /84

23 Estimoidaan. asteen vastepintamallin parametrit pienimmän neliösumman menetelmällä. Olkoot parametrien PNS-estimaattorit Tällöin pätee β 0, β, β, β b 0, b, b, b b b b b 0 = y = = = iii X X A X B AB Estimoitu. asteen vastepinnan yhtälö saa siten muodon Olkoon X X X yˆ = y + x + x + x x A B AB iii SST = SSM + SSE. asteen vastepintamallin selitettävän muuttujan y arvojen vaihtelua kuvaavan kokonaisneliösumman SST varianssianalyysihajotelma, jossa Voidaan osoittaa, että SSM = Estimoidun mallin mallineliösumma SSE = Estimoidun mallin jäännösneliösumma SSM = SSA + SSB + SSAB joten estimoidun mallin jäännösneliösumma SSE yhtyy edellä esitetyn kaksisuuntaisen varianssianalyysimallin jäännösneliösummaan. Tehtävän 0.. ratkaisu: Tekijän A tasojen lukumäärä: I = Tekijän B tasojen lukumäärä: J = Havaintojen lukumäärä jokaisessa tekijöiden A ja B tasojen määräämässä ryhmässä (i, j): n = 3 Siten havaintojen kokonaislukumäärä on I J n = n = 4 3 = Ilkka Mellin (005) 3/84

24 Alla olevaan taulukkoon on laskettu havaintojen summat eri käsittelykombinaatioille: A B Summa () = = 80 + a = = 00 + b = = ab = = 90 Tekijän A päävaikutus: Tekijän B päävaikutus: X A = ( ab+ a b ()) = ( ) = n 6 XB = ( ab a+ b ()) = ( ) = 5 n 6 Tekijöiden A ja B interaktio eli yhdysvaikutus: X AB = ( ab a b+ ()) = ( ) =.6667 n 6 Tekijöiden A ja B päävaikutuksia ja yhdysvaikutusta kuvaavat neliösummat: SSA = nx A SSB = nx B SSAB = nx AB = = 75 = Kaikkien havaintoarvojen aritmeettinen keskiarvo: yiii = ( ab+ a+ b+ ()) = ( ) = 330 = 7.5 4n 4 3 Kaikkien havaintoarvojen neliöiden summa: n 3 ykij ykij i= j= k= i= j= k= = = 9398 Kaikkien havaintoarvojen kokonaisvaihtelua kuvaava neliösumma: n kij iii = i= j= k= SST = y 4ny = Jäännösneliösummaksi saadaan varianssianalyysihajotelman nojalla SSE = SST SSA SSB SSAB = = Ilkka Mellin (005) 4/84

25 -testisuureiden laskeminen Olkoon nollahypoteesina H AB : Ei yhdysvaikutusta Testisuureen AB arvoksi saadaan SSAB AB = 4( n ) SSE = 4(3 ) =.8 Jos nollahypoteesi H AB pätee, niin (, 4( n )) = (,8) AB Olkoon nollahypoteesina H A : Ei A-vaikutusta Testisuureen A arvoksi saadaan A SSA = 4( n ) SSE = 4(3 ) = 53.9 Jos nollahypoteesi H A pätee, niin (, 4( n )) = (,8) A Olkoon nollahypoteesina H B : Ei B-vaikutusta Testisuureen B arvoksi saadaan SSA B = 4( n ) SSE 75 = 4(3 ) = 9.49 Jos nollahypoteesi H B pätee, niin (, 4( n )) = (,8) B Ilkka Mellin (005) 5/84

26 Testien tekeminen Olkoon nollahypoteesina H AB : Ei yhdysvaikutusta Testisuureen arvoksi saatiin AB =.8 Testisuureen arvoa vastaavaksi p-arvoksi saadaan esimerkiksi Excel-ohjelmalla Pr(.8) = 0.83 Siten nollahypoteesia H AB ei voida hylätä merkitsevyystasolla Taulukoiden mukaan jossa Koska Pr( 5.38) = 0.05 (, 4( n )) = (,8) AB =.8 < 5.38 voimme todeta (kuten edellä), että nollahypoteesia H AB ei voida hylätä merkitsevyystasolla Olkoon nollahypoteesina H A : Ei A-vaikutusta Testisuureen arvoksi saatiin = 53.9 A Testisuureen arvoa vastaavaksi p-arvoksi saadaan esimerkiksi Excel-ohjelmalla Pr( 53.9) = Siten nollahypoteesi H A voidaan hylätä kaikilla tavanomaisilla merkitsevyystasoilla. Taulukoiden mukaan jossa Koska Pr(.59) = 0.0 (, 4( n )) = (,8) = 53.9 >.59 A voimme todeta, että nollahypoteesi H A voidaan hylätä merkitsevyystasolla 0.0. Ilkka Mellin (005) 6/84

27 Olkoon nollahypoteesina H B : Ei B-vaikutusta Testisuureen arvoksi saatiin = 9.49 B Testisuureen arvoa vastaavaksi p-arvoksi saadaan esimerkiksi Excel-ohjelmalla Pr( 9.49) = Siten nollahypoteesi H B voidaan hylätä merkitsevyystasolla 0.0. Taulukoiden mukaan jossa Koska Pr(.59) = 0.0 (, 4( n )) = (,8) = 9.49 B >.59 voimme todeta, että nollahypoteesi H A voidaan hylätä merkitsevyystasolla 0.0. Testien tulokset voidaan koota seuraavaksi varianssianalyysitaulukoksi: Vaihtelun lähde SS df MS p A B AB E T Johtopäätös Tekijöillä A ja B ei ole interaktiota, mutta molemmilla tekijöillä on päävaikutus. Ilkka Mellin (005) 7/84

28 Vastepintamallin estimointi Tekijöiden A ja B arvojen koodaus tapahtuu yhtälöillä A (5+ 5)/ A 0 x = =, A= A, A (5 5)/ 5 B ( + )/ B.5 x = =, B= B, B ( ) / 0.5 Estimoiduksi. asteen vastepintamalliksi saadaan edellä esitettyjen tulosten perustella X A XB X AB yˆ = yiii + x+ x + xx = x x + xx = x.5x x x + + Sama tulos saadaan soveltamalla PNS-menetelmää malliin y = β + β x + β x + β x x +ε 0 Estimoitu regressioyhtälö saa tekijöiden A ja B luonnollisissa mittayksiköissä muodon yˆ = x.5x x x A 0 B.5 A 0 B.5 = = A.667B AB Tehtävän 0.. ratkaiseminen tilastollisella ohjelmistolla: Tehtävän aineisto koodattuna Ncss-ohjelmaa varten: Data Report Data List Section Row Yield Concentration Catalyst TCon TCat TConTCat Ilkka Mellin (005) 8/84

29 Ncss-ohjelma antaa seuraavan tulostuksen, kun aineistoon sovelletaan kaksisuuntaista varianssianalyysia (faktoreina luonnolliset muuttujat): Analysis of Variance Report Response: Yield Expected Mean Squares Section Source Term Denominator Expected Term D ixed? Term Mean Square A: Concentration Yes S(AB) S+bsA B: Catalyst Yes S(AB) S+asB AB Yes S(AB) S+sAB S(AB) 8 No S Note: Expected Mean Squares are for the balanced cell-frequency case. Analysis of Variance Table Source Sum of Mean Prob Power Term D Squares Square -Ratio Level (Alpha=0.05) A: Concentration * B: Catalyst * AB S Total (Adjusted) 33 Total * Term significant at alpha = 0.05 Means and Standard Error Section Standard Term Count Mean Error All 7.5 A: Concentration B: Catalyst AB: Concentration,Catalyst 5, , , , Ilkka Mellin (005) 9/84

30 Plots Section Means of Yield Yield Concentration Means of Yield Yield Catalyst Means of Yield Catalyst Yield Concentration Ilkka Mellin (005) 30/84

31 Bonferroni (All-Pairwise) Multiple Comparison Test Response: Yield Term A: Concentration Alpha=0.050 Error Term=S(AB) D=8 MSE= Critical Value= Different Group Count Mean rom Groups Bonferroni (All-Pairwise) Multiple Comparison Test Response: Yield Term B: Catalyst Alpha=0.050 Error Term=S(AB) D=8 MSE= Critical Value= Different Group Count Mean rom Groups Bonferroni (All-Pairwise) Multiple Comparison Test Response: Yield Term AB: Concentration,Catalyst Alpha=0.050 Error Term=S(AB) D=8 MSE= Critical Value= Different Group Count Mean rom Groups 5, 3 0 (5,), (5,), (5,) 5, (5,), (5,) 5, 3 30 (5,) 5, (5,), (5,) Ilkka Mellin (005) 3/84

32 Ncss-ohjelma antaa seuraavan tulostuksen, kun aineistoon sovelletaan lineaarista regressioanalyysia (selittäjinä koodatut muuttujat): Multiple Regression Report Dependent Yield Descriptive Statistics Section Standard Variable Count Mean Deviation Minimum Maximum TCon E TCat E TConTCat E Yield Regression Equation Section Independent Regression Standard T-Value Prob Decision Power Variable Coefficient Error (Ho: B=0) Level (5%) (5%) Intercept Reject Ho TCon Reject Ho TCat Reject Ho TConTCat Accept Ho R-Squared Model *TCon-.5*TCat *TConTCat Regression Coefficient Section Independent Regression Standard Lower Upper Standardized Variable Coefficient Error 95% C.L. 95% C.L. Coefficient Intercept TCon TCat TConTCat T-Critical Analysis of Variance Section Sum of Mean Prob Power Source D Squares Square -Ratio Level (5%) Intercept Model Error Total(Adjusted) Root Mean Square Error R-Squared Mean of Dependent 7.5 Adj R-Squared Coefficient of Variation E-0 Press Value 70.5 Sum Press Residuals 5 Press R-Squared Ilkka Mellin (005) 3/84

33 Normality Tests Section Assumption Value Probability Decision(5%) Skewness Accepted Kurtosis Accepted Omnibus Accepted Serial-Correlation Section Durbin-Watson Value.8475 Sum of Squares and Correlation Section Independent Sequential Incremental Last Simple Partial Variable Sum Squares Sum Squares Sum Squares Correlation Correlation TCon TCat TConTCat Plots Section 3.0 Normal Probability Plot of Residuals of Yield Residuals of Yield Expected Normals Ilkka Mellin (005) 33/84

34 Vastepintamenetelmä Vastepintamenetelmässä pyritään vasteen riippuvuutta siihen vaikuttavista tekijöistä approksimoimaan tekijöiden polynomimuotoisella funktiolla, jota kutsutaan vastepintamalliksi. Tärkeimpiä motiiveja polynomimuotoisten vastepintamallien käyttämiselle on se, että polynomimuotoisten vastepintamallien avulla on helppo etsiä vasteeseen vaikuttavien tekijöiden arvojen optimaalista kombinaatiota. Vastepintamenetelmä on vaiheittain etenevä mallinrakentamisstrategia, jonka aikana joudutaan tavallisesti keräämään myös uusia havaintoja. Rajoitumme tässä esittelemään vastepintamallin soveltamista -koeasetelmaan. -koeasetelmassa tutkitaan kahden tekijän vaikutusta vastemuuttujaan, kun kummallekin tekijälle valitaan kokeessa kaksi tasoa. Tehtävät muodostavat jakokertomuksen, jossa näytetään miten erään kemiallisen prosessin saannolle löydetään optimaalinen reaktioaika-lämpötila-kombinaatio -koeasetelmaa ja vastepintamenetelmää käyttäen. () Tehtävässä 0.3. tutkitaan kemiallisen prosessin saannon riippuvuutta reaktioajasta ja lämpötilasta -koeasetelmaa käyttäen. Reaktioajan ja lämpötilan vaikutusten estimointiin riittää se, että vastemuuttujan arvo on mitattu kerran jokaisella -koeasetelman tekijöiden tasojen neljällä kombinaatiolla. Tällöin vastemuuttujaan vaikuttavien tekijöiden tilastollisen merkitsevyyden testaaminen ei ole kuitenkaan mahdollista. () Tehtävässä 0.4. tehtävän koeasetelmaan liitetään keskipiste. Keskipistehavaintojen liittäminen -koeasetelmaan tekee sekä vastemuuttujaan vaikuttavien tekijöiden tilastollisen merkitsevyyden että vastefunktion (kvadraattisen) kaarevuuden (epälineaarisuuden) testaamisen mahdolliseksi. (3) Jos vastepintaa voidaan approksimoida. asteen vastepinnalla, voidaan soveltaa gradienttimenetelmää vasteeseen vaikuttavien tekijöiden optimaalisten arvojen alueen etsimiseen. Gradienttimenetelmässä kerätään uusia havaintoja siitä suunnasta, jossa vastefunktio kasvaa nopeimmin, kunnes optimaalinen vasteeseen vaikuttavien tekijöiden arvojen alue löydetään. Kun vasteen kannalta optimaalinen tekijöiden arvojen alue on löydetty (tehtävä 0.4.), alueelta kerätään uudet havainnot sellaisen -koeasetelman mukaan, johon on liitetty keskipiste. (4) Tehtävässä 0.5. uusista havainnoista estimoidaan vasteeseen vaikuttavien tekijöiden efektit sekä testataan vastepinnan (kvadraattista) kaarevuutta. (5) Jos (kvadraattista) kaarevuutta esiintyy (tehtävä 0.5.), liitetään. asteen vastepintamalliin tekijöiden. potenssit ja estimoidaan havainnoista. asteen vastepintamalli. Tämä vaatii lisähavaintojen keräämistä sopivasti valituista suunnista.. asteen vastepintamallin avulla on helppo löytää se reaktioajan ja lämpötilan arvojen kombinaatio, joka optimoi vasteen arvon. Ilkka Mellin (005) 34/84

35 0.3. Insinööri tutkii kemiallisen prosessin saantoa. Saantoon voidaan vaikuttaa reaktioajalla ja prosessin lämpötilalla. Insinööri tutkii tilannetta aluksi valitsemalla vain kaksi reaktioaikaa ja kaksi lämpötilaa sekä mittaamalla saannot. Tulokset on annettu alla olevassa taulukossa. Reaktioaika min Lämpötila Saanto Määrää saantoon vaikuttavien tekijöiden päävaikutukset ja interaktio. Huomaa, että näiden tekijöiden tilastollista merkitystä ei voida testata. Miksi? Teoriaa: Tehtävän koeasetelmana on -faktorikoe. -faktorikokeen tulosten analysoinnissa käytettävät kaavat on esitelty tehtävässä 0.. Tehtävän 0.3. ratkaisu: Tekijän A tasojen lukumäärä: I = Tekijän B tasojen lukumäärä: J = Havaintojen lukumäärä jokaisessa tekijöiden A ja B tasojen määräämässä ryhmässä (i, j): n = Siten havaintojen kokonaislukumäärä on I J n = n = = 4 Alla olevaan taulukkoon on laskettu havaintojen summat eri käsittelykombinaatioille: A B Summa () = a = b = ab = 4.5 Ilkka Mellin (005) 35/84

36 Koeasetelman havainnollistus: + b = 40.0 ab = 4.5 B () = 39.3 a = 40.9 Tekijän A päävaikutus: Tekijän B päävaikutus: X A = ( ab+ a b ()) = ( ) =.55 n XB = ( ab a+ b ()) = ( ) = 0.65 n Tekijöiden A ja B interaktio eli yhdysvaikutus: X AB = ( ab a b+ ()) = ( ) = 0.05 n Tekijöiden A ja B päävaikutuksia ja yhdysvaikutusta kuvaavat neliösummat: SSA = nx A SSB = nx B SSAB = nx AB =.405 = 0.45 = Havaintoarvojen aritmeettinen keskiarvo: A yiii = ( ab+ a+ b+ ()) = ( ) = 6.7 = n 4 4 Havaintoarvojen neliöiden summa: n ykij ykij i= j= k= i= j= k= = = Havaintoarvojen kokonaisvaihtelua kuvaava neliösumma: n kij iii i= j= k= SST = y 4ny = =.875 Varianssianalyysihajotelman nojalla jäännösneliösumma on + SSE = SST SSA SSB SSAB = = 0 Ilkka Mellin (005) 36/84

37 Tämä on sopusoinnussa sen kanssa, että jokaisesta tekijöiden A ja B tasojen määräämästä ryhmästä (i, j) on vain yksi havainto, jolloin ryhmien sisäistä vaihtelua ei ole ja sitä kuvaavan jäännösneliösumman SSE pitääkin hävitä. Koska SSE = 0 niin tekijöiden A ja B päävaikutuksien ja interaktion tilastollista merkitsevyyttä ei voida testata. Analyysin tulokset voidaan kuitenkin koota seuraavaksi varianssianalyysitaulukoksi: Vaihtelun lähde SS df MS p A B AB E 0 0 T Vastepintamallin estimointi Tekijöiden A ja B arvojen koodaus tapahtuu yhtälöillä: A ( ) / A 35 x = =, A= A, A (40 30) / 5 + B ( ) / B 55 x = =, B= B, B (60 50) / 5 + Estimoiduksi. asteen vastepintamalliksi saadaan edellä esitettyjen tulosten perustella X A XB X AB yˆ = yiii + x+ x + x x = x+ x xx = x x 0.05x x Sama tulos saadaan soveltamalla PNS-menetelmää malliin y = β + β x + β x + β x x +ε 0 Ilkka Mellin (005) 37/84

38 Estimoitu regressioyhtälö saa luonnollisissa mittayksiköissä muodon yˆ = x x 0.05x x A 35 B 55 A 35 B 55 = = A+ 0.B 0.00AB Tehtävän 0.3. ratkaiseminen tilastollisella ohjelmistolla: Tehtävän aineisto koodattuna Ncss-ohjelmaa varten: Data Report Data List Section Row Y A B Ilkka Mellin (005) 38/84

39 Ncss-ohjelma antaa seuraavan tulostuksen, kun aineistoon sovelletaan -faktorikokeen mallia: Analysis of Two-Level Designs Design Information Section Input Data Response: Y Rows: 4 Reps: Blocks: None actor actor Level Level Symbol Name One Two A() A - B() B - Design / replication of factors. Confounding / Alias Section Term Terms No. Confounded A B 3 AB Means and Effects Section for Y Term Term Estimated Standard No. Symbol Mean - Mean + Effect Error 0 Grand Mean A (A) B (B) AB Sorted Means and Effects Section for Y Term Term Estimated Standard No. Symbol Mean - Mean + Effect Error 0 Grand Mean A (A) B (B) AB Ilkka Mellin (005) 39/84

40 Analysis of Variance Section for Y Term Term Mean Prob Statistically No. Symbol D Square -Ratio Level Significant A (A) Yes B (B) Yes 3 AB Yes Error Total Means and Effects of B by A for Y A A B - Effect Overall Effect Overall Probability Plots Section.0 Normal Probability Plot of Effects.4 Effects Expected Normals Ilkka Mellin (005) 40/84

41 0.4. Jatkoa tehtävälle 0.3. Insinöörin tavoitteena on käyttää vastepintamenetelmää prosessin analysoimiseksi. Hän päättää lisätä tehtävän 0.3. asetelmaan keskipisteen, jossa suoritetaan viisi mittausta. Tulokset lisämittauksista on annettu alla olevassa taulukossa. Reaktioaika min Lämpötila Saanto Teoriaa: Liitä nämä uudet havainnot tehtävän 0.3. aineistoon, estimoi yhdistetystä aineistosta. asteen vastepinta ja testaa saantoon vaikuttavien tekijöiden päävaikutuksien ja interaktion merkitystä sekä testaa myös vastefunktion kaarevuutta. Tehtävän koeasetelmana on -faktorikoe, johon on liitetty keskipiste. Keskipistehavaintojen liittäminen kokeeseen ei vaikuta tekijöiden A ja B päävaikutuksiin ja interaktioon ja niihin liittyviin neliösummiin. Sen sijaan keskipistehavainnot mahdollistavat ns. puhtaan virheen määräämisen ja siten myös tekijöiden A ja B päävaikutuksien ja interaktion tilastollisen merkityksen testaamisen. Lisäksi keskipistehavaintojen avulla voidaan testata vastefunktion (kvadraattista) kaarevuutta. Kutsumme -faktorikokeen alkuperäisiä havaintoja kulmapistehavainnoiksi. Jos jokaista -faktorikokeen käsittelykombinaatiota on toistettu kokeessa n kertaa, kulmapistehavaintojen lukumäärä on n= 4n= n (merkintä) -faktorikokeen tulosten kulmapistehavaintoihin perustuvassa analyysissa käytettävät kaavat on esitelty tehtävässä 0.. Ilkka Mellin (005) 4/84

42 Olkoon jossa Olkoon y kij = muuttujan y k. havaintoarvo kulmapisteessä, jonka määrittelee tekijän A taso i ja tekijän B taso j, k =,,, n, i =,, j =, A = ( ) i = A = (+) i = B = ( ) j = B = (+) j = T y n = kij i= j= k= havaintoarvojen summa kulmapisteissä. Huomaa, että T = a b+ a+ b+ () jossa ab = Havaintoarvojen summa, kun A = (+), B = (+) a = Havaintoarvojen summa, kun A = (+), B = ( ) b = Havaintoarvojen summa, kun A = ( ), B = (+) () = Havaintoarvojen summa, kun A = ( ), B = ( ) Olkoon y = T n havaintoarvojen aritmeettinen keskiarvo kulmapisteissä. Huomaa, että Olkoon y = ( ab+ a+ b+ ( )) 4n Q n = i= j= k= havaintoarvojen neliöiden summa kulmapisteissä. y kij Ilkka Mellin (005) 4/84

43 Keskipistehavaintojen liittäminen -koeasetelmaan Olkoon A = Tekijän A matala arvo A + = Tekijän A korkea arvo B = Tekijän B matala arvo B + = Tekijän B korkea arvo Olkoon AC = ( A + A+ ) BC = ( B + B+ ) Sanomme, että piste (A C, B C ) on -koeasetelman keskipiste. Olkoot keskipisteessä (A C, B C ) saadut havaintoarvot z, k =,,, n k Olkoon N = n + n C kaikkien havaintoarvojen lukumäärä. Olkoon T C n C = z k = k havaintoarvojen summa keskipisteessä ja olkoon T = T +T C C kaikkien havaintoarvojen summa (havaintoarvojen summa kulmapisteissä ja keskipisteessä). Havaintoarvojen aritmeettinen keskiarvo keskipisteessä on y C = T n C C ja kaikkien havaintoarvojen aritmeettinen keskiarvo on y = ( T + TC) = T n + n N C Ilkka Mellin (005) 43/84

44 Olkoon Q C n C = z k = k havaintoarvojen neliöiden summa keskipisteessä ja olkoon Q= Q + Q C kaikkien havaintoarvojen neliöiden summa (havaintoarvojen neliöiden summa kulmapisteissä ja keskipisteessä). Kaikkien havaintoarvojen kokonaisvaihtelua kuvaava neliösumma on T SST = Q N Jäännösneliösumma Olkoon SSE = SST SSA SSB SSAB jäännösneliösumma, jossa neliösummat SSA, SSB ja SSAB lasketaan kulmapistehavainnoista; ks. tehtävä 0.. Puhdas virhe Määritellään puhdasta virhettä kuvaava neliösumma kaavalla jossa n n C ( kij iij ) ( k C ) i= j= k= k= SSPE = y y + z y = + Qiij Tiij QC TC i= j= n i= j= nc n T = y, i =,, j =, iij k = kij on havaintoarvojen summa kulmapisteessä (i, j), yiij = Ti ij, i =,, j =, n on havaintoarvojen aritmeettinen keskiarvo kulmapisteessä (i, j) ja n Q = y, i =,, j =, iij k = kij on havaintoarvojen neliöiden summa kulmapisteessä (i, j). Ilkka Mellin (005) 44/84

45 Havaintoarvojen tavanomainen otosvarianssi kulmapisteessä (i, j) on s = ( y y ), i =,, j =, i n ij kij ij n k = ja havaintoarvojen tavanomainen otosvarianssi keskipisteessä on s n C C = ( zi y ) n C C i= Jos jokaisessa kulmapisteessä on käytettävissä on vain yksi havainto eli n =, niin n C SSPE = ( z y ) = Q T k = k C C C nc Puhdas kvadraattinen kaarevuus (Lack of it) Vastefunktion puhdasta kvadraattista kaarevuutta kuvaa neliö jossa nn C SSPQ = ( y yc) n + n C y = havaintoarvojen aritmeettinen keskiarvo kulmapisteissä y C = havaintoarvojen aritmeettinen keskiarvo keskipisteessä n n C = havaintojen lukumäärä kulmapisteissä = havaintojen lukumäärä keskipisteessä Varianssianalyysihajotelma -faktorikokeen, johon on liitetty keskipiste, varianssianalyysihajotelma on muotoa SST = SSA + SSB + SSAB + SSPQ + SSPE Huomaa, että tekijöiden A ja B päävaikutuksiin ja interaktioon liittyvät neliösummat SSA, SSB ja SSAB voidaan määrätä käyttämällä pelkästään kulmapistehavaintoja. Varianssianalyysihajotelman neliösummien vapausasteet toteuttavat vastaavan yhtälön n + n C + = (n + n C 5) Keskipistehavaintojen liittäminen faktorikokeeseen mahdollistaa jäännösneliösumman SSE hajottamisen puhdasta kvadraattista kaarevuutta kuvaavan neliösumman SSPQ ja puhdasta virhettä kuvaavan neliösumman SSPE summaksi: SSE = SSPQ + SSPE Neliösummiin SSE, SSPQ ja SSPE liittyvät vapausasteet toteuttavat yhtälön n + n C 4 = + (n + n C 5) Ilkka Mellin (005) 45/84

46 Testit Määritellään -testisuureet ( n + nc 5) SSAB SSAB AB = = ( n + nc 5) ( )( ) SSPE SSPE ( n + nc 5) SSA SSA A = = ( n + nc 5) ( ) SSPE SSPE ( n + nc 5) SSB SSB B = = ( n + nc 5) ( ) SSPE SSPE ( n + nc 5) SSPQ SSPQ PQ = = ( n + nc 5) SSPE SSPE Jos nollahypoteesi H AB : Ei yhdysvaikutusta pätee, niin (( )( ),( n + n 5)) = (,( n + n 5)) AB C C Suuret testisuureen AB arvot johtavat nollahypoteesin H AB hylkäämiseen. Jos nollahypoteesi pätee, niin H A : Ei A-vaikutusta (( ),( n + n 5)) = (,( n + n 5)) A C Suuret testisuureen A arvot johtavat nollahypoteesin H A hylkäämiseen. Jos nollahypoteesi pätee, niin H B : Ei B-vaikutusta (( ),( n + n 5)) = (,( n + n 5)) B C Suuret testisuureen B arvot johtavat nollahypoteesin H B hylkäämiseen. Jos nollahypoteesi H PQ : Ei puhdasta kvadraattista kaarevuutta pätee, niin (, ( n + n )) PQ C Suuret testisuureen B arvot johtavat nollahypoteesin H B hylkäämiseen. C C Ilkka Mellin (005) 46/84

47 -kokeen, johon on liitetty keskipiste, testien tulokset ilmaistaan tavallisesti varianssianalyysitaulukon muodossa: Vaihtelun lähde Neliösumma SS Vapausasteet df Varianssiestimaattori MS -testisuure A SSA MSA = SSA B SSB MSB = SSB AB SSAB MSAB = SSAB PQ SSPQ MSPQ = SSPQ MSA = MSPE MSB = MSPE MSAB = MSPE MSPQ = MSPE PE SSPE n n C 5 E SSE n + n C 4 SSPE MSPE = n + n 5 C SSE MSE = n + n 4 C Kokonaisvaihtelu SST n +n C Varianssianalyysitaulukon neliösummat toteuttavat varianssianalyysihajotelman SST = SSA + SSB + SSAB + SSE jossa SSE = SSPQ + SSPE Lisäksi neliösummiin liittyvät vapausasteet toteuttavat vastaavat yhtälöt n + n C = (n + n C 4) ja n + n C 4 = + n + n C 5 Ilkka Mellin (005) 47/84

48 . asteen vastepintamalli Siirrytään luonnollisista tekijöiden A ja B mittayksiköistä koodattuihin muuttujan arvoihin yhtälöllä X ( X+ + X )/ x =, X = X, X ( X X )/ + Koodatun muuttujan x arvot ovat, jos X X x = + =, jos X = X + + Määritellään vastemuuttujalle y. asteen vastepintamalli jossa y = β + β x + β x + β x x +ε 0 x = Tekijää A vastaava koodattu muuttuja x = Tekijää B vastaava koodattu muuttuja Estimoidaan. asteen vastepintamallin parametrit pienimmän neliösumman menetelmällä käyttäen kaikkia havaintoja. Olkoot parametrien PNS-estimaattorit Tällöin pätee β 0, β, β, β b 0, b, b, b b b b b 0 = y = = = X X A X B AB Estimoitu. asteen vastepinnan yhtälö saa siten muodon X A XB X AB yˆ = y+ x+ x + x x Ilkka Mellin (005) 48/84

49 Tehtävän 0.4 ratkaisu: Yhteenveto tehtävän 0.3. ratkaisusta Tekijän A tasojen lukumäärä: I = Tekijän B tasojen lukumäärä: J = Havaintojen lukumäärä tekijöiden A ja B tasojen määräämässä ryhmässä (i, j), i =,, j =, : n = Kulmapistehavaintojen lukumäärä: n = I J n = = 4 Koeasetelman havainnollistus: + b = 40.0 ab = 4.5 B () = 39.3 A Tekijän A päävaikutus: Tekijän B päävaikutus: a = X A = ( ab+ a b ()) = ( ) =.55 n XB = ( ab a+ b ()) = ( ) = 0.65 n Tekijöiden A ja B interaktio eli yhdysvaikutus: X AB = ( ab a b+ ()) = ( ) = 0.05 n Ilkka Mellin (005) 49/84

50 Tekijöiden A ja B päävaikutuksia ja yhdysvaikutusta kuvaavat neliösummat: SSA = nx A SSB = nx B SSAB = nx AB =.405 = 0.45 = Kulmapistehavaintojen summa: T = a b+ a+ b+ () = = 6.7 Kulmapistehavaintojen aritmeettinen keskiarvo: y = T = 6.7 = n 4 Kulmapistehavaintojen neliöiden summa: n kij kij i= j= k= i= j= k= Q = y = y = Kulmapistehavaintojen kokonaisvaihtelua kuvaava neliösumma: SST = Q T = =.875 4n 4 Kulmapistehavaintoihin perustuvan varianssianalyysin tulokset voidaan koota seuraavaksi varianssianalyysitaulukoksi: Vaihtelun lähde SS df MS p A B AB E 0 0 T Keskipistehavaintojen liittäminen kokeeseen Vastemuuttujasta on kerätty 5 havaintoa keskipisteessä. Keskipisteen (A C, B C ) koordinaatit saadaan yhtälöistä AC = ( A + A+ ) = ( ) = 35 BC = ( B + B+ ) = ( ) = 55 Ilkka Mellin (005) 50/84

51 Kaikkien havaintojen lukumäärä on N = n + n C = = 9 Keskipistehavaintojen summa: n C T = z = 0.3 C k = k Keskipistehavaintojen aritmeettinen keskiarvo: y C = TC = 0.3 = n 5 Kaikkien havaintoarvojen summa: C T = T + = = 364 TC Kaikkien havaintoarvojen aritmeettinen keskiarvo: 364 y = T = = N 9 Keskipistehavaintojen neliöiden summa: Q C n C = z = k = k Kaikkien havaintoarvojen neliöiden summa: Q= Q + Q = = C Kaikkien havaintoarvojen kokonaisvaihtelua kuvaava neliösumma: T 364 SST = Q = = 3.00 N 9 Puhdasta virhettä kuvaava neliösumma on tässä 0.3 SSPE = z y = Q T = = n C ( k C) C C k = nc 5 Koska kulmapistehavaintojen aritmeettinen keskiarvo on y = ja keskipistehavaintojen aritmeettinen keskiarvo on y C = niin puhdasta kvadraattista kaarevuutta kuvaavaksi neliösummaksi saadaan nn 45 SSPQ = y y = = n + + C ( C) ( ) nc 4 5 Ilkka Mellin (005) 5/84

52 Testit Testi tekijöiden A ja B interaktiolle: SSAB AB = ( n + nc 5) = ( ) = SSPE 0.7 Koska testisuureen arvoa vastaava p-arvo on 0.8, nollahypoteesia H AB : Ei yhdysvaikutusta ei voida hylätä millään tavanomaisella merkitsevyystasolla. Testi tekijän A päävaikutukselle: SSA.405 A = ( n + nc 5) = ( ) = SSPE 0.7 Koska testisuureen arvoa vastaava p-arvo on 0.007, nollahypoteesi H A : Ei A-vaikutusta voidaan hylätä esimerkiksi merkitsevyystasolla 0.0. Testi tekijän B päävaikutukselle: SSB 0.45 B = ( n + nc 5) = (4+ 5 5) SSPE 0.7 Koska testisuureen arvoa vastaava p-arvo on 0.035, nollahypoteesi H B : Ei B-vaikutusta voidaan hylätä merkitsevyystasolla 0.05, mutta ei merkitsevyystasolla 0.0. Testi puhtaalle kvadraattiselle kaarevuudelle: SSPQ PQ = ( n + nc 5) = ( ) = SSPE 0.7 Koska testisuureen arvoa vastaava p-arvo on 0.8, nollahypoteesia H PQ : Ei kaarevuutta ei voida hylätä millään tavanomaisella merkitsevyystasolla. Ilkka Mellin (005) 5/84

53 Analyysin tulokset voidaan koota seuraavaksi varianssianalyysitaulukoksi: Vaihtelun lähde SS df MS p A B AB PQ PE T Johtopäätös Tekijöillä A ja B ei ole interaktiota, mutta molemmilla tekijöillä on päävaikutus. Lisäksi vastemuuttujan riippuvuutta tekijöistä A ja B voidaan approksimoida tarkastellulla alueella. asteen vastepinnalla. Vastepintamallin estimointi Tekijöiden A ja B arvojen koodaus tapahtuu yhtälöillä: A ( ) / A 35 x = =, A= A, A (40 30) / 5 + B ( ) / B 55 x = =, B= B, B (60 50) / 5 + Estimoiduksi. asteen vastepintamalliksi saadaan edellä esitettyjen tulosten perustella X X X ˆ = = x+ x xx = x x 0.05x x A B AB y y x x xx Sama tulos saadaan soveltamalla PNS-menetelmää malliin y = β + β x + β x + β x x +ε 0 Ilkka Mellin (005) 53/84

54 Estimoitu regressioyhtälö saa luonnollisissa mittayksiköissä muodon yˆ = x x 0.05x x A 35 B 55 A 35 B 55 = = A+ 0.B 0.00AB Tehtävän 0.4. ratkaiseminen tilastollisella ohjelmistolla: Tehtävän aineisto koodattuna Ncss-ohjelmaa varten: Data Report Data List Section Row Y A B AB Ilkka Mellin (005) 54/84

55 Ncss-ohjelma antaa seuraavan tulostuksen, kun aineistoon sovitetaan. asteen vastepinta: Response-Surface Regression Report Response Y Descriptive Statistics Section Variable Count Mean Minimum Maximum A B Y Hierarchical Model Summary Section Number of Terms Removed 0 Number of Terms Remaining 3 R-Squared Cutoff Value R-Squared of inal Model Coded Hierarchical Model A B A A () B B Notes: or off-diagonal entries: =uw, =uw, 3=uw, 4=uw, 5=uw3,6=u3w, 7=uw3, 8=u3w, 9=u3w3. or diagonal entries: =u, =u, 3=u3. Where u=u, u=u^=u*u, and u3=u^3=u*u*u. Sequential ANOVA Section Sequential Mean Prob Incremental Source df Sum-Squares Square -Ratio Level R-Squared Regression Linear Lin x Lin Total Error E Lack of it.7e-03.7e Pure Error Sequential ANOVA Section Using Pure Error Sequential Mean Prob Incremental Source df Sum-Squares Square -Ratio Level R-Squared Regression Linear Lin x Lin Total Error E Lack of it.7e-03.7e Pure Error Ilkka Mellin (005) 55/84

Kaksisuuntaisen varianssianalyysin tilastollisessa malli voidaan esittää seuraavassa muodossa:

Kaksisuuntaisen varianssianalyysin tilastollisessa malli voidaan esittää seuraavassa muodossa: Mat-.03 Koesuunnittelu ja tilastolliset mallit Mat-.03 Koesuunnittelu ja tilastolliset mallit / Ratkaisut Aiheet: Avainsanat: Kaksisuuntainen varianssianalsi Aritmeettinen keskiarvo, Estimointi, F-testi,

Lisätiedot

Vastepintamenetelmä. Heliövaara 1

Vastepintamenetelmä. Heliövaara 1 Vastepintamenetelmä Kurssipalautteen antamisesta saa hyvityksenä yhden tenttipisteen. Palautelomakkeeseen tulee lähiaikoina linkki kurssin kotisivuille. Heliövaara 1 Vastepintamenetelmä Vastepintamenetelmässä

Lisätiedot

Altistusaika 1 kk 2 kk 3 kk 1.35 1.53 1.38 1.35 1.63 1.51 1.60 1.40 2.18 1.77 1.66 1.98 1.73 1.76 1.60 1.72

Altistusaika 1 kk 2 kk 3 kk 1.35 1.53 1.38 1.35 1.63 1.51 1.60 1.40 2.18 1.77 1.66 1.98 1.73 1.76 1.60 1.72 Mat-.03 Koesuunnittelu ja tilastolliset mallit Mat-.03 Koesuunnittelu ja tilastolliset mallit / Ratkaisut iheet: vainsanat: Kaksisuuntainen varianssianalsi Lohkoasetelmat Latinalaiset neliöt ritmeettinen

Lisätiedot

Hierarkkiset koeasetelmat. Heliövaara 1

Hierarkkiset koeasetelmat. Heliövaara 1 Hierarkkiset koeasetelmat Heliövaara 1 Hierarkkiset koeasetelmat Kaksiasteista hierarkkista koeasetelmaa käytetään tarkasteltaessa seuraavaa kysymystä: Miten varianssianalyysissa tutkitaan kahden tekijän

Lisätiedot

2 k -faktorikokeet. Vilkkumaa / Kuusinen 1

2 k -faktorikokeet. Vilkkumaa / Kuusinen 1 2 k -faktorikokeet Vilkkumaa / Kuusinen 1 Motivointi 2 k -faktorikoe on k-suuntaisen varianssianalyysin erikoistapaus, jossa kaikilla tekijöillä on vain kaksi tasoa, matala (-) ja korkea (+). 2 k -faktorikoetta

Lisätiedot

Vastepintamenetelmä. Kuusinen/Heliövaara 1

Vastepintamenetelmä. Kuusinen/Heliövaara 1 Vastepintamenetelmä Kuusinen/Heliövaara 1 Vastepintamenetelmä Vastepintamenetelmässä pyritään vasteen riippuvuutta siihen vaikuttavista tekijöistä approksimoimaan tekijöiden polynomimuotoisella funktiolla,

Lisätiedot

Koesuunnittelu 2 k -faktorikokeet. TKK (c) Ilkka Mellin (2005) 1

Koesuunnittelu 2 k -faktorikokeet. TKK (c) Ilkka Mellin (2005) 1 Koesuunnittelu 2 k -faktorikokeet TKK (c) Ilkka Mellin (2005) 2 k -faktorikokeet 2 2 -faktorikokeet 2 3 -faktorikokeet 2 k -faktorikokeet TKK (c) Ilkka Mellin (2005) 2 2 k -faktorikokeet: Mitä opimme?

Lisätiedot

Koesuunnittelu Vastepintamenetelmä. TKK (c) Ilkka Mellin (2005) 1

Koesuunnittelu Vastepintamenetelmä. TKK (c) Ilkka Mellin (2005) 1 Koesuunnittelu Vastepintamenetelmä TKK (c) Ilkka Mellin (2005) 1 Vastepintamenetelmä Vastepintamenetelmä: Johdanto 2 k -faktorikokeet Vastefunktion kaarevuuden testaaminen 1. asteen vastepintamallin varianssianalyysihajotelma

Lisätiedot

Kaksisuuntainen varianssianalyysi. Heliövaara 1

Kaksisuuntainen varianssianalyysi. Heliövaara 1 Kaksisuuntainen varianssianalyysi Heliövaara 1 Kaksi- tai useampisuuntainen varianssianalyysi Kaksi- tai useampisuuntaisessa varianssianalyysissa perusjoukko on jaettu ryhmiin kahden tai useamman tekijän

Lisätiedot

Kaksisuuntainen varianssianalyysi. Vilkkumaa / Kuusinen 1

Kaksisuuntainen varianssianalyysi. Vilkkumaa / Kuusinen 1 Kaksisuuntainen varianssianalyysi Vilkkumaa / Kuusinen 1 Motivointi Luennot 6 ja 7: yksisuuntaisella varianssianalyysilla testataan ryhmäkohtaisten odotusarvojen yhtäsuuruutta, kun perusjoukko on jaettu

Lisätiedot

Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt: Mitä opimme? Latinalaiset neliöt

Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt: Mitä opimme? Latinalaiset neliöt TKK (c) Ilkka Mellin (005) Koesuunnittelu TKK (c) Ilkka Mellin (005) : Mitä opimme? Tarkastelemme tässä luvussa seuraavaa kysymystä: Miten varianssianalyysissa tutkitaan yhden tekijän vaikutusta vastemuuttujaan,

Lisätiedot

Vastepintamenetelmä. Vilkkumaa / Kuusinen 1

Vastepintamenetelmä. Vilkkumaa / Kuusinen 1 Vastepintamenetelmä Vilkkumaa / Kuusinen 1 Motivointi Varianssianalyysissa tutkitaan tekijöiden vaikutusta vasteeseen siten, että tekijöiden tasot on ennalta valittu. - Esim. tutkitaan kemiallisen prosessin

Lisätiedot

2 2 -faktorikokeen määritelmä

2 2 -faktorikokeen määritelmä TKK (c) Ilkka Mellin (005) Koesuunnittelu TKK (c) Ilkka Mellin (005) : Mitä opimme? Tarkastelemme tässä luvussa seuraavaa kysymystä: Miten varianssianalyysissa tutkitaan kahden tai useamman tekijän vaikutusta

Lisätiedot

1. PÄÄTTELY YHDEN SELITTÄJÄN LINEAARISESTA REGRESSIOMALLISTA

1. PÄÄTTELY YHDEN SELITTÄJÄN LINEAARISESTA REGRESSIOMALLISTA Mat-2.104 Tilastollisen analyysin perusteet / Ratkaisut Aiheet: Avainsanat Päättely yhden selittäjän lineaarisesta regressiomallista Ennustaminen, Ennuste, Ennusteen luottamusväli, Estimaatti, Estimaattori,

Lisätiedot

VARIANSSIANALYYSI ANALYSIS OF VARIANCE

VARIANSSIANALYYSI ANALYSIS OF VARIANCE VARIANSSIANALYYSI ANALYSIS OF VARIANCE 1 Suomalaisten aikuisten pituusjakauma:.8.7.6.5.4.3.2.1 14 15 16 17 18 19 2 21 Jakauma ei ole normaali, sen olettaminen sellaiseksi johtaa virheellisiin päätelmiin.

Lisätiedot

Koesuunnittelu Latinalaiset neliöt. TKK (c) Ilkka Mellin (2005) 1

Koesuunnittelu Latinalaiset neliöt. TKK (c) Ilkka Mellin (2005) 1 Koesuunnittelu Latinalaiset neliöt TKK (c) Ilkka Mellin (2005) 1 Latinalaiset neliöt Latinalaisten neliöiden koeasetelma ja sen malli Latinalaisten neliöiden koeasetelman analysointi Laskutoimitusten suorittaminen

Lisätiedot

1. KAKSISUUNTAINEN VARIANSSIANALYYSI: TULOSTEN TULKINTA

1. KAKSISUUNTAINEN VARIANSSIANALYYSI: TULOSTEN TULKINTA Mat-2.104 Tilastollisen analyysin perusteet / Ratkaisut Aiheet: Avainsanat: Kaksisuuntainen varianssianalyysi Bonferronin menetelmä, F-testi, Jäännösneliösumma, Kaksisuuntainen varianssianalyysi Kokonaiskeskiarvo,

Lisätiedot

Johdatus tilastotieteeseen Kaksisuuntainen varianssianalyysi. TKK (c) Ilkka Mellin (2005) 1

Johdatus tilastotieteeseen Kaksisuuntainen varianssianalyysi. TKK (c) Ilkka Mellin (2005) 1 ohdatus tilastotieteeseen Kaksisuuntainen varianssianalyysi TKK (c) Ilkka Mellin (2005) Kaksisuuntainen varianssianalyysi Varianssianalyysi: ohdanto Kaksisuuntainen varianssianalyysi ja sen suorittaminen

Lisätiedot

Johdatus varianssianalyysiin. Vilkkumaa / Kuusinen 1

Johdatus varianssianalyysiin. Vilkkumaa / Kuusinen 1 Johdatus varianssianalyysiin Vilkkumaa / Kuusinen 1 Motivointi Luento 4: kahden riippumattoman otoksen odotusarvoja voidaan vertailla t-testillä H 0 : μ 1 = μ 2, T = ˉX 1 ˉX 2 s 2 1 + s2 2 n 1 n 2 a t(min[(n

Lisätiedot

Testejä suhdeasteikollisille muuttujille

Testejä suhdeasteikollisille muuttujille Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Testejä suhdeasteikollisille muuttujille TKK (c) Ilkka Mellin (007) 1 Testejä suhdeasteikollisille muuttujille >> Testit normaalijakauman

Lisätiedot

1. YKSISUUNTAINEN VARIANSSIANALYYSI: AINEISTON ESITYSMUODOT

1. YKSISUUNTAINEN VARIANSSIANALYYSI: AINEISTON ESITYSMUODOT Mat-2.104 Tilastollisen analyysin perusteet / Ratkaisut Aiheet: Avainsanat: Yksisuuntainen varianssianalyysi Bartlettin testi, Bonferronin menetelmä, F-testi, Jäännösneliösumma, χ 2 -testi, Kokonaiskeskiarvo,

Lisätiedot

Lohkoasetelmat. Heliövaara 1

Lohkoasetelmat. Heliövaara 1 Lohkoasetelmat Heliövaara 1 Kiusatekijä Kaikissa kokeissa, kokeen tuloksiin voi vaikuttaa vaihtelu joka johtuu kiusatekijästä. Kiusatekijä on tekijä, jolla mahdollisesti on vaikutusta vastemuuttujan arvoon,

Lisätiedot

Keskipisteen lisääminen 2 k -faktorikokeeseen (ks. Montgomery 9-6)

Keskipisteen lisääminen 2 k -faktorikokeeseen (ks. Montgomery 9-6) Mat-.3 Koesuunnittelu ja tilastolliset mallit kevät Keskipisteen lisääminen k -faktorikokeeseen (ks. Montgomery 9-6) Esim (Montg. ex. 9-, 6-): Tutkitaan kemiallisen prosessin saannon Y riippuvuutta faktoreista

Lisätiedot

7. Lohkominen ja sulautus 2 k kokeissa. Lohkominen (Blocking)

7. Lohkominen ja sulautus 2 k kokeissa. Lohkominen (Blocking) 7. Lohkominen ja sulautus 2 k kokeissa Lohkominen (Blocking) Lohkotekijät muodostuvat faktoreista, joiden suhteen ei voida tehdä (täydellistä) satunnaistamista. Esimerkiksi faktorikokeessa raaka-aine-erät

Lisätiedot

Kertausluento. Vilkkumaa / Kuusinen 1

Kertausluento. Vilkkumaa / Kuusinen 1 Kertausluento Vilkkumaa / Kuusinen 1 Kokeellinen tutkimus Kokeellisessa tutkimuksessa on tavoitteena selvittää, miten erilaiset käsittelyt vaikuttavat tutkimuksen kohteisiin - Esim. miten lämpötila ja

Lisätiedot

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1 Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Tilastollinen testaus TKK (c) Ilkka Mellin (2007) 1 Tilastolliset testit >> Tilastollinen testaus Tilastolliset hypoteesit Tilastolliset

Lisätiedot

Lohkoasetelmat. Kuusinen/Heliövaara 1

Lohkoasetelmat. Kuusinen/Heliövaara 1 Lohkoasetelmat Kuusinen/Heliövaara 1 Kiusatekijä Kaikissa kokeissa kokeen tuloksiin voi vaikuttaa vaihtelu, joka johtuu kiusatekijästä. Kiusatekijä on tekijä, jolla on mahdollisesti vaikutusta vastemuuttujan

Lisätiedot

Regressioanalyysi. Vilkkumaa / Kuusinen 1

Regressioanalyysi. Vilkkumaa / Kuusinen 1 Regressioanalyysi Vilkkumaa / Kuusinen 1 Regressioanalyysin idea ja tavoitteet Regressioanalyysin idea: Halutaan selittää selitettävän muuttujan havaittujen arvojen vaihtelua selittävien muuttujien havaittujen

Lisätiedot

Testit järjestysasteikollisille muuttujille

Testit järjestysasteikollisille muuttujille Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Testit järjestysasteikollisille muuttujille TKK (c) Ilkka Mellin (2007) 1 Testit järjestysasteikollisille muuttujille >> Järjestysasteikollisten

Lisätiedot

1. Normaalisuuden tutkiminen, Bowmanin ja Shentonin testi, Rankit Plot, Wilkin ja Shapiron testi

1. Normaalisuuden tutkiminen, Bowmanin ja Shentonin testi, Rankit Plot, Wilkin ja Shapiron testi Mat-2.2104 Tilastollisen analyysin perusteet / Ratkaisut Aiheet: Avainsanat: Yhteensopivuuden ja homogeenisuden testaaminen Bowmanin ja Shentonin testi, Hypoteesi, 2 -homogeenisuustesti, 2 -yhteensopivuustesti,

Lisätiedot

Regressioanalyysi. Kuusinen/Heliövaara 1

Regressioanalyysi. Kuusinen/Heliövaara 1 Regressioanalyysi Kuusinen/Heliövaara 1 Regressioanalyysin idea ja tavoitteet Regressioanalyysin idea: Oletetaan, että haluamme selittää jonkin selitettävän muuttujan havaittujen arvojen vaihtelun joidenkin

Lisätiedot

Tilastollinen vastepintamallinnus: kokeiden suunnittelu, regressiomallin analyysi, ja vasteen optimointi. Esimerkit laskettu JMP:llä

Tilastollinen vastepintamallinnus: kokeiden suunnittelu, regressiomallin analyysi, ja vasteen optimointi. Esimerkit laskettu JMP:llä Tilastollinen vastepintamallinnus: kokeiden suunnittelu, regressiomallin analyysi, ja vasteen optimointi Esimerkit laskettu JMP:llä Antti Hyttinen Tampereen teknillinen yliopisto 29.12.2003 ii Ohjelmien

Lisätiedot

54. Tehdään yhden selittäjän lineaarinen regressioanalyysi, kun selittäjänä on määrällinen muuttuja (ja selitettävä myös):

54. Tehdään yhden selittäjän lineaarinen regressioanalyysi, kun selittäjänä on määrällinen muuttuja (ja selitettävä myös): Tilastollinen tietojenkäsittely / SPSS Harjoitus 5 Tarkastellaan ensin aineistoa KUNNAT. Kyseessähän on siis kokonaistutkimusaineisto, joten tilastollisia testejä ja niiden merkitsevyystarkasteluja ei

Lisätiedot

Esim Brand lkm keskiarvo keskihajonta A ,28 5,977 B ,06 3,866 C ,95 4,501

Esim Brand lkm keskiarvo keskihajonta A ,28 5,977 B ,06 3,866 C ,95 4,501 Esim. 2.1.1. Brand lkm keskiarvo keskihajonta A 10 251,28 5,977 B 10 261,06 3,866 C 10 269,95 4,501 y = 260, 76, n = 30 SS 1 = (n 1 1)s 2 1 = (10 1)5, 977 2 321, 52 SS 2 = (n 2 1)s 2 2 = (10 1)3, 8662

Lisätiedot

Kvantitatiiviset tutkimusmenetelmät maantieteessä

Kvantitatiiviset tutkimusmenetelmät maantieteessä Kvantitatiiviset tutkimusmenetelmät maantieteessä Harjoitukset: 2 Muuttujan normaaliuden testaaminen, merkitsevyys tasot ja yhden otoksen testit FT Joni Vainikka, Yliopisto-opettaja, GO218, joni.vainikka@oulu.fi

Lisätiedot

Kaksitasoiset hierarkiset asetelmat (Two-Stage Nested Designs) 9. Muita koeasetelmia. 9.1 Hierarkiset asetelmat (Nested Designs)

Kaksitasoiset hierarkiset asetelmat (Two-Stage Nested Designs) 9. Muita koeasetelmia. 9.1 Hierarkiset asetelmat (Nested Designs) 9. Muita koeasetelmia 9.1 Hierarkiset asetelmat (Nested Designs) Tietyissä koetilanteissa yhden faktorin tasot ovat samanlaisia joskaan ei täysin identtisiä toisen faktorin eri tasoilla. Tällaista asetelmaa

Lisätiedot

Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1

Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1 Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1 Odotusarvoparien vertailu Jos yksisuuntaisen varianssianalyysin nollahypoteesi H 0 : µ 1 = µ 2 = = µ k = µ hylätään tiedetään, että ainakin kaksi

Lisätiedot

1. USEAN SELITTÄJÄN LINEAARINEN REGRESSIOMALLI JA OSITTAISKORRELAATIO

1. USEAN SELITTÄJÄN LINEAARINEN REGRESSIOMALLI JA OSITTAISKORRELAATIO Mat-2.104 Tilastollisen analyysin perusteet / Ratkaisut Aiheet: Avainsanat Usean selittäjän lineaarinen regressiomalli Estimaatti, Estimaattori, Estimointi, Jäännösneliösumma, Jäännöstermi, Jäännösvarianssi,

Lisätiedot

Perusnäkymä yksisuuntaiseen ANOVAaan

Perusnäkymä yksisuuntaiseen ANOVAaan Metsämuuronen 2006. TTP Tutkimuksen tekemisen perusteet ihmistieteissä Taulukko.51.1 Analyysiin mukaan tulevat muuttujat Mja selite Merkitys mallissa F1 Ensimmäinen faktoripistemuuttuja Selitettävä muuttuja

Lisätiedot

7. Lohkominen ja sulautus 2 k kokeissa. Lohkominen (Blocking)

7. Lohkominen ja sulautus 2 k kokeissa. Lohkominen (Blocking) 7. Lohkominen ja sulautus 2 k kokeissa Lohkominen (Blocking) Lohkotekijät muodostuvat faktoreista, joiden suhteen ei voida tehdä (täydellistä) satunnaistamista. Esimerkiksi faktorikokeessa raaka-aine-erät

Lisätiedot

Mat Tilastollisen analyysin perusteet, kevät 2007

Mat Tilastollisen analyysin perusteet, kevät 2007 Mat-2.2104 Tilastollisen analyysin perusteet, kevät 2007 2. luento: Tilastolliset testit Kai Virtanen 1 Tilastollinen testaus Tutkimuksen kohteena olevasta perusjoukosta esitetään väitteitä oletuksia joita

Lisätiedot

Useampisuuntainen varianssianalyysi. Useampisuuntainen varianssianalyysi. Useampisuuntainen varianssianalyysi

Useampisuuntainen varianssianalyysi. Useampisuuntainen varianssianalyysi. Useampisuuntainen varianssianalyysi (c) lkka Mellin (005) Useampisuuntainen varianssianalsi ohdatus tilastotieteeseen Useampisuuntainen varianssianalsi (c) lkka Mellin (005) Useampisuuntainen varianssianalsi: Mitä opimme? arkastelemme tässä

Lisätiedot

Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1

Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1 Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1 Odotusarvoparien vertailu Jos yksisuuntaisen varianssianalyysin nollahypoteesi H 0 : µ 1 = µ 2 = = µ k = µ hylätään, tiedetään, että ainakin

Lisätiedot

Lohkotekijät muodostuvat faktoreista, joiden suhteen ei voida tehdä (täydellistä) satunnaistamista.

Lohkotekijät muodostuvat faktoreista, joiden suhteen ei voida tehdä (täydellistä) satunnaistamista. 7. Lohkominen ja sulautus 2 k kokeissa Lohkominen (Blocking) Lohkotekijät muodostuvat faktoreista, joiden suhteen ei voida tehdä (täydellistä) satunnaistamista. Esimerkiksi faktorikokeessa raaka-aine-erät

Lisätiedot

Ongelma: Poikkeaako perusjoukon suhteellinen osuus vertailuarvosta?

Ongelma: Poikkeaako perusjoukon suhteellinen osuus vertailuarvosta? Yhden otoksen suhteellisen osuuden testaus Ongelma: Poikkeaako perusjoukon suhteellinen osuus vertailuarvosta? Hypoteesit H 0 : p = p 0 H 1 : p p 0 tai H 1 : p > p 0 tai H 1 : p < p 0 Suhteellinen osuus

Lisätiedot

9.1 Hierarkiset asetelmat (Nested Designs)

9.1 Hierarkiset asetelmat (Nested Designs) 9. Muita koeasetelmia 9.1 Hierarkiset asetelmat (Nested Designs) Tietyissä koetilanteissa yhden faktorin tasot ovat samanlaisia joskaan ei täysin identtisiä toisen faktorin eri tasoilla. Tällaista asetelmaa

Lisätiedot

χ = Mat Sovellettu todennäköisyyslasku 11. harjoitukset/ratkaisut

χ = Mat Sovellettu todennäköisyyslasku 11. harjoitukset/ratkaisut Mat-2.091 Sovellettu todennäköisyyslasku /Ratkaisut Aiheet: Yhteensopivuuden testaaminen Homogeenisuuden testaaminen Riippumattomuuden testaaminen Avainsanat: Estimointi, Havaittu frekvenssi, Homogeenisuus,

Lisätiedot

Yhden faktorin koeasetelma, jossa faktorilla on a tasoa (kokeessa on a käsittelyä).

Yhden faktorin koeasetelma, jossa faktorilla on a tasoa (kokeessa on a käsittelyä). 3. Yhden faktorin kokeet 3.1 Varianssianalyysi Yhden faktorin koeasetelma, jossa faktorilla on a tasoa (kokeessa on a käsittelyä). Esimerkki 3.1: Tutkitaan kankaassa käytettävän synteettisen kuidun vetolujuutta,

Lisätiedot

Tavoite on eliminoida sen vaikutus koetuloksista. 4. Satunnaistetut lohkokokeet, latinalaiset neliöt ja vastaavat asetelmat. Eliminointimenetelmiä:

Tavoite on eliminoida sen vaikutus koetuloksista. 4. Satunnaistetut lohkokokeet, latinalaiset neliöt ja vastaavat asetelmat. Eliminointimenetelmiä: 4. Satunnaistetut lohkokokeet, latinalaiset neliöt ja vastaavat asetelmat 4.1 Satunnaistettu lohkokoe (Randomized Block Design) Kiusatekijä (nuisance factor): Kiusatekijä on taustatekijä, joka voi vaikuttaa

Lisätiedot

3. Yhden faktorin kokeet. 3.1 Varianssianalyysi. Yhden faktorin koeasetelma, jossa faktorilla on a tasoa (kokeessa on a käsittelyä).

3. Yhden faktorin kokeet. 3.1 Varianssianalyysi. Yhden faktorin koeasetelma, jossa faktorilla on a tasoa (kokeessa on a käsittelyä). 3. Yhden faktorin kokeet 3.1 Varianssianalyysi Yhden faktorin koeasetelma, jossa faktorilla on a tasoa (kokeessa on a käsittelyä). Esimerkki 3.1: Tutkitaan kankaassa käytettävän synteettisen kuidun vetolujuutta,

Lisätiedot

Väliestimointi (jatkoa) Heliövaara 1

Väliestimointi (jatkoa) Heliövaara 1 Väliestimointi (jatkoa) Heliövaara 1 Bernoulli-jakauman odotusarvon luottamusväli 1/2 Olkoon havainnot X 1,..., X n yksinkertainen satunnaisotos Bernoulli-jakaumasta parametrilla p. Eli X Bernoulli(p).

Lisätiedot

Tässä harjoituksessa käydään läpi R-ohjelman käyttöä esimerkkidatan avulla. eli matriisissa on 200 riviä (havainnot) ja 7 saraketta (mittaus-arvot)

Tässä harjoituksessa käydään läpi R-ohjelman käyttöä esimerkkidatan avulla. eli matriisissa on 200 riviä (havainnot) ja 7 saraketta (mittaus-arvot) R-ohjelman käyttö data-analyysissä Panu Somervuo 2014 Tässä harjoituksessa käydään läpi R-ohjelman käyttöä esimerkkidatan avulla. 0) käynnistetään R-ohjelma Huom.1 allaolevissa ohjeissa '>' merkki on R:n

Lisätiedot

Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen., jos otoskeskiarvo on suurempi kuin 13,96. Mikä on testissä käytetty α:n arvo?

Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen., jos otoskeskiarvo on suurempi kuin 13,96. Mikä on testissä käytetty α:n arvo? MTTTP5, kevät 2016 15.2.2016/RL Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen 1. Valitaan 25 alkion satunnaisotos jakaumasta N(µ, 25). Olkoon H 0 : µ = 12. Hylätään H 0, jos otoskeskiarvo

Lisätiedot

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme? TKK (c) Ilkka Mellin (2004) 1 Johdatus tilastotieteeseen TKK (c) Ilkka Mellin (2004) 2 Mitä opimme? 1/4 Tilastollisen tutkimuksen tavoitteena on tehdä johtopäätöksiä prosesseista, jotka generoivat reaalimaailman

Lisätiedot

Harjoitus 9: Excel - Tilastollinen analyysi

Harjoitus 9: Excel - Tilastollinen analyysi Harjoitus 9: Excel - Tilastollinen analyysi Mat-2.2107 Sovelletun matematiikan tietokonetyöt Syksy 2006 Mat-2.2107 Sovelletun matematiikan tietokonetyöt 1 Harjoituksen aiheita Tutustuminen regressioanalyysiin

Lisätiedot

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin Tilastollisen analyysin perusteet Luento 10: Sisältö Varianssianalyysi Varianssianalyysi on kahden riippumattoman otoksen t testin yleistys. Varianssianalyysissä perusjoukko koostuu kahdesta tai useammasta

Lisätiedot

Tilastollisten menetelmien perusteet II TILTP3 Luentorunko

Tilastollisten menetelmien perusteet II TILTP3 Luentorunko Tilastollisten menetelmien perusteet II TILTP3 Luentorunko Raija Leppälä 29. helmikuuta 2012 Sisältö 1 Johdanto 2 1.1 Jatkuvista jakaumista 2 1.1.1 Normaalijakauma 2 1.1.2 Studentin t-jakauma 3 1.2 Satunnaisotos,

Lisätiedot

OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi. Luento 3

OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi. Luento 3 OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi Luento 3 Tutkimussuunnitelman rakenne-ehdotus Otsikko 1. Motivaatio/tausta 2. Tutkimusaihe/ -tavoitteet ja kysymykset

Lisätiedot

Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit

Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit s t ja t kahden Sisältö t ja t t ja t kahden kahden t ja t kahden t ja t Tällä luennolla käsitellään epäparametrisia eli

Lisätiedot

3. Yhden faktorin kokeet. 3.1 Varianssianalyysi. Yhden faktorin koeasetelma, jossa faktorilla on a tasoa (kokeessa on a käsittelyä).

3. Yhden faktorin kokeet. 3.1 Varianssianalyysi. Yhden faktorin koeasetelma, jossa faktorilla on a tasoa (kokeessa on a käsittelyä). 3. Yhden faktorin kokeet 3.1 Varianssianalyysi Yhden faktorin koeasetelma, jossa faktorilla on a tasoa (kokeessa on a käsittelyä). Esimerkki 3.1: Tutkitaan kankaassa käytettävän synteettisen kuidun vetolujuutta,

Lisätiedot

(d) Laske selittäjään paino liittyvälle regressiokertoimelle 95 %:n luottamusväli ja tulkitse tulos lyhyesti.

(d) Laske selittäjään paino liittyvälle regressiokertoimelle 95 %:n luottamusväli ja tulkitse tulos lyhyesti. 2. VÄLIKOE vuodelta -14 1. Liitteessä 1 on esitetty R-ohjelmalla saatuja tuloksia aineistosta, johon on talletettu kahdenkymmenen satunnaisesti valitun miehen paino (kg), vyötärön ympärysmitta (cm) ja

Lisätiedot

r = 0.221 n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit.

r = 0.221 n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit. A. r = 0. n = Tilastollista testausta varten määritetään aluksi hypoteesit. H 0 : Korrelaatiokerroin on nolla. H : Korrelaatiokerroin on nollasta poikkeava. Tarkastetaan oletukset: - Kirjoittavat väittävät

Lisätiedot

Odotusarvoparien vertailu. Vilkkumaa / Kuusinen 1

Odotusarvoparien vertailu. Vilkkumaa / Kuusinen 1 Odotusarvoparien vertailu Vilkkumaa / Kuusinen 1 Motivointi Viime luennolta: yksisuuntaisella varianssianalyysilla testataan nollahypoteesia H 0 : μ 1 = μ 2 = = μ k = μ Jos H 0 hylätään, tiedetään, että

Lisätiedot

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1 Johdatus tilastotieteeseen Estimointi TKK (c) Ilkka Mellin (2005) 1 Estimointi Todennäköisyysjakaumien parametrit ja niiden estimointi Hyvän estimaattorin ominaisuudet TKK (c) Ilkka Mellin (2005) 2 Estimointi:

Lisätiedot

USEAN MUUTTUJAN REGRESSIOMALLIT JA NIIDEN ANA- LYYSI

USEAN MUUTTUJAN REGRESSIOMALLIT JA NIIDEN ANA- LYYSI TEORIA USEAN MUUTTUJAN REGRESSIOMALLIT JA NIIDEN ANA- LYYSI Regressiomalleilla kuvataan tilanteita, jossa suureen y arvot riippuvat joukosta ns selittäviä muuttujia x 1, x 2,..., x p oletetun funktiomuotoisen

Lisätiedot

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä arvon Sisältö arvon Bootstrap-luottamusvälit arvon arvon Oletetaan, että meillä on n kappaletta (x 1, y 1 ),

Lisätiedot

Osa 2: Otokset, otosjakaumat ja estimointi

Osa 2: Otokset, otosjakaumat ja estimointi Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi TKK (c) Ilkka Mellin (2007) 1 Estimointi >> Todennäköisyysjakaumien parametrit ja niiden estimointi Hyvän estimaattorin

Lisätiedot

Harjoitus 7: NCSS - Tilastollinen analyysi

Harjoitus 7: NCSS - Tilastollinen analyysi Harjoitus 7: NCSS - Tilastollinen analyysi Mat-2.2107 Sovelletun matematiikan tietokonetyöt Syksy 2006 Mat-2.2107 Sovelletun matematiikan tietokonetyöt 1 Harjoituksen aiheita Tilastollinen testaus Testaukseen

Lisätiedot

Tilastollisen analyysin perusteet Luento 4: Testi suhteelliselle osuudelle

Tilastollisen analyysin perusteet Luento 4: Testi suhteelliselle osuudelle Tilastollisen analyysin perusteet Luento 4: Sisältö Testiä suhteelliselle voidaan käyttää esimerkiksi tilanteessa, jossa tarkastellaan viallisten tuotteiden osuutta tuotantoprosessissa. Tilanne palautuu

Lisätiedot

Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi

Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi TKK (c) Ilkka Mellin (2006) 1 Estimointi >> Todennäköisyysjakaumien parametrit ja niiden estimointi Hyvän estimaattorin

Lisätiedot

Johdatus regressioanalyysiin. Heliövaara 1

Johdatus regressioanalyysiin. Heliövaara 1 Johdatus regressioanalyysiin Heliövaara 1 Regressioanalyysin idea Oletetaan, että haluamme selittää jonkin selitettävän muuttujan havaittujen arvojen vaihtelun selittävien muuttujien havaittujen arvojen

Lisätiedot

Otoskoko 107 kpl. a) 27 b) 2654

Otoskoko 107 kpl. a) 27 b) 2654 1. Tietyllä koneella valmistettavien tiivisterenkaiden halkaisijan keskihajonnan tiedetään olevan 0.04 tuumaa. Kyseisellä koneella valmistettujen 100 renkaan halkaisijoiden keskiarvo oli 0.60 tuumaa. Määrää

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 8. marraskuuta 2007 Antti Rasila () TodB 8. marraskuuta 2007 1 / 18 1 Kertausta: momenttimenetelmä ja suurimman uskottavuuden menetelmä 2 Tilastollinen

Lisätiedot

Testit laatueroasteikollisille muuttujille

Testit laatueroasteikollisille muuttujille Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Testit laatueroasteikollisille muuttujille TKK (c) Ilkka Mellin (2007) 1 Testit laatueroasteikollisille muuttujille >> Laatueroasteikollisten

Lisätiedot

Mat Tilastollisen analyysin perusteet, kevät 2007

Mat Tilastollisen analyysin perusteet, kevät 2007 Mat-.04 Tilastollisen analsin perusteet, kevät 007. luento: Kaksisuuntainen varianssianalsi Kai Virtanen Kaksisuuntaisen varianssianalsin perusasetelma Jaetaan perusjoukko rhmiin kahden tekän A ja B suhteen

Lisätiedot

Residuaalit. Residuaalit. UK Ger Fra US Austria. Maat

Residuaalit. Residuaalit. UK Ger Fra US Austria. Maat TAMPEREEN YLIOPISTO Tilastollisen mallintamisen harjoitustyö Teemu Kivioja ja Mika Helminen Epätasapainoisen koeasetelman analyysi Worksheet 5 Matematiikan, tilastotieteen ja filosofian laitos Tilastotiede

Lisätiedot

Tilastollisen analyysin perusteet Luento 9: Moniulotteinen lineaarinen. regressio

Tilastollisen analyysin perusteet Luento 9: Moniulotteinen lineaarinen. regressio Tilastollisen analyysin perusteet Luento 9: lineaarinen lineaarinen Sisältö lineaarinen lineaarinen lineaarinen Lineaarinen Oletetaan, että meillä on n kappaletta (x 1, y 1 ), (x 2, y 2 )..., (x n, y n

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 22. marraskuuta 2007 Antti Rasila () TodB 22. marraskuuta 2007 1 / 17 1 Epäparametrisia testejä (jatkoa) χ 2 -riippumattomuustesti 2 Johdatus regressioanalyysiin

Lisätiedot

Tavanomaisten otostunnuslukujen, odotusarvon luottamusvälin ja Box ja Whisker -kuvion määritelmät: ks. 1. harjoitukset.

Tavanomaisten otostunnuslukujen, odotusarvon luottamusvälin ja Box ja Whisker -kuvion määritelmät: ks. 1. harjoitukset. Mat-.04 Tilastollisen analyysin perusteet Mat-.04 Tilastollisen analyysin perusteet / Ratkaisut Aiheet: Avainsanat: Testit suhdeasteikollisille muuttujille Hypoteesi, Kahden riippumattoman otoksen t-testit,

Lisätiedot

MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op)

MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op) MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op) Aalto-yliopisto 2016 Käytannön järjestelyt Luennot: Luennot ma 4.1. (sali E) ja ti 5.1 klo 10-12 (sali C) Luennot 11.1.-10.2. ke 10-12 ja ma 10-12

Lisätiedot

Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1 Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille TKK (c) Ilkka Mellin (2004) 1 Testit laatueroasteikollisille muuttujille Laatueroasteikollisten muuttujien testit Testi suhteelliselle

Lisätiedot

Faktorikokeilla tarkoitetaan koesuunnitelmaa, jossa koe toistetaan kaikilla faktoreiden tasojen kombninaatioilla.

Faktorikokeilla tarkoitetaan koesuunnitelmaa, jossa koe toistetaan kaikilla faktoreiden tasojen kombninaatioilla. 5. Johdatus faktorikokeisiin 5.1 Taustaa Faktorikokeilla tarkoitetaan koesuunnitelmaa, jossa koe toistetaan kaikilla faktoreiden tasojen kombninaatioilla. Täten, jos faktorilla A on a tasoa ja faktorilla

Lisätiedot

Testaa onko myrkkypitoisuus eri ryhmissä sama. RATK. Lasketaan kaikkien havaintoarvojen summa: k T i = = 486.

Testaa onko myrkkypitoisuus eri ryhmissä sama. RATK. Lasketaan kaikkien havaintoarvojen summa: k T i = = 486. Mat-.103 Koesuunnittelu ja tilastolliset mallit Harjoitus 8, kevät 004 Esimerkkiratkaisut. 1. Myrkyllistä ainetta oli kaadettu jokeen, joka johtaa suurelle kalastusalueelle. Tie- ja vesirakennusinsinöörit

Lisätiedot

Frequencies. Frequency Table

Frequencies. Frequency Table GET FILE='C:\Documents and Settings\haukkala\My Documents\kvanti\kvanti_harjo'+ '_label.sav'. DATASET NAME DataSet WINDOW=FRONT. FREQUENCIES VARIABLES=koulv paino /ORDER= ANALYSIS. Frequencies [DataSet]

Lisätiedot

xi = yi = 586 Korrelaatiokerroin r: SS xy = x i y i ( x i ) ( y i )/n = SS xx = x 2 i ( x i ) 2 /n =

xi = yi = 586 Korrelaatiokerroin r: SS xy = x i y i ( x i ) ( y i )/n = SS xx = x 2 i ( x i ) 2 /n = 1. Tutkitaan paperin ominaispainon X(kg/dm 3 ) ja puhkaisulujuuden Y (m 2 ) välistä korrelaatiota. Tiettyä laatua olevasta paperierästä on otettu satunnaisesti 10 arkkia ja määritetty jokaisesta arkista

Lisätiedot

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

Tilastollinen testaus. Vilkkumaa / Kuusinen 1 Tilastollinen testaus Vilkkumaa / Kuusinen 1 Motivointi Viime luennolla: havainnot generoineen jakauman muoto on usein tunnettu, mutta parametrit tulee estimoida Joskus parametreista on perusteltua esittää

Lisätiedot

Estimointi. Vilkkumaa / Kuusinen 1

Estimointi. Vilkkumaa / Kuusinen 1 Estimointi Vilkkumaa / Kuusinen 1 Motivointi Tilastollisessa tutkimuksessa oletetaan jonkin jakauman generoineen tutkimuksen kohteena olevaa ilmiötä koskevat havainnot Tämän mallina käytettävän todennäköisyysjakauman

Lisätiedot

voidaan hylätä, pienempi vai suurempi kuin 1 %?

voidaan hylätä, pienempi vai suurempi kuin 1 %? [MTTTP1] TILASTOTIETEEN JOHDANTOKURSSI, Syksy 2017 http://www.uta.fi/sis/mtt/mtttp1/syksy_2017.html HARJOITUS 5 viikko 42 6.10.2017 klo 10:42:20 Ryhmät: ke 08.30 10.00 LS C6 Paajanen ke 10.15 11.45 LS

Lisätiedot

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170 VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE 4.6.2013 Ratkaisut ja arvostelu 1.1 Satunnaismuuttuja X noudattaa normaalijakaumaa a) b) c) d) N(170, 10 2 ). Tällöin P (165 < X < 175) on likimain

Lisätiedot

3. Useamman selittäajäan regressiomalli. p-selittäaväaäa muuttujaa. Y i = + 1 X i1 +...+ p X ip + u i

3. Useamman selittäajäan regressiomalli. p-selittäaväaäa muuttujaa. Y i = + 1 X i1 +...+ p X ip + u i 3. Useamman selittäajäan regressiomalli p-selittäaväaäa muuttujaa Y i = + 1 X i1 +...+ p X ip + u i i = 1,...,n (> p), missäa n = havaintojen lukumäaäaräa otoksessa. Oletukset kuten aiemmin: (1) E(u i

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 16. marraskuuta 2007 Antti Rasila () TodB 16. marraskuuta 2007 1 / 15 1 Epäparametrisia testejä χ 2 -yhteensopivuustesti Homogeenisuuden testaaminen Antti

Lisätiedot

Tilastollisen analyysin perusteet Luento 7: Lineaarinen regressio

Tilastollisen analyysin perusteet Luento 7: Lineaarinen regressio Tilastollisen analyysin perusteet Luento 7: Lineaarinen regressio Sisältö Regressioanalyysissä tavoitteena on tutkia yhden tai useamman selittävän muuttujan vaikutusta selitettävään muuttujaan. Sen avulla

Lisätiedot

A250A0050 Ekonometrian perusteet Tentti

A250A0050 Ekonometrian perusteet Tentti A250A0050 Ekonometrian perusteet Tentti 28.9.2016 Tentissä ei saa käyttää laskinta. Tentistä saa max 80 pistettä. Hyväksytysti suoritetusta harjoitustyöstä saa max 20 pistettä. Huom. Merkitse vastauspaperin

Lisätiedot

MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op)

MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op) MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op) Aalto-yliopisto 2017 Käytännön järjestelyt Luennot: Luennot maanantaisin (sali E) ja keskiviikkoisin (sali U4) klo 10-12 Luennoitsija: (lauri.viitasaari@aalto.fi)

Lisätiedot

Tilastollisen analyysin perusteet Luento 11: Epäparametrinen vastine ANOVAlle

Tilastollisen analyysin perusteet Luento 11: Epäparametrinen vastine ANOVAlle Tilastollisen analyysin perusteet Luento 11: Epäparametrinen vastine ANOVAlle - Sisältö - - - Varianssianalyysi Varianssianalyysissä (ANOVA) testataan oletusta normaalijakautuneiden otosten odotusarvojen

Lisätiedot

ABHELSINKI UNIVERSITY OF TECHNOLOGY

ABHELSINKI UNIVERSITY OF TECHNOLOGY Tilastollinen testaus Tilastollinen testaus Tilastollisessa testauksessa tutkitaan tutkimuskohteita koskevien oletusten tai väitteiden paikkansapitävyyttä havaintojen avulla. Testattavat oletukset tai

Lisätiedot

proc glm data = ex61; Title2 "Aliasing Structure of the 2_IV^(5-1) design"; model y = A B C D E /Aliasing; run; quit;

proc glm data = ex61; Title2 Aliasing Structure of the 2_IV^(5-1) design; model y = A B C D E /Aliasing; run; quit; Title "Exercises 6"; Data ex61; input A B C D E y @@; Label A = "Furnance Temperature" B = "Heating Time" C = "Transfer Time" D = "Hold Down Time" E = "Quench of Oil Temperature" y = "Free Height of Leaf

Lisätiedot

Mat Tilastollisen analyysin perusteet, kevät 2007

Mat Tilastollisen analyysin perusteet, kevät 2007 Mat-.104 Tilastollisen analyysin perusteet, kevät 007 8. luento: Usean selittäjän lineaarinen regressiomalli Kai Virtanen 1 Usean selittäjän lineaarinen regressiomalli Selitettävän muuttujan havaittujen

Lisätiedot

5. Johdatus faktorikokeisiin. Tekijän omaa vaikutusta vastemuuttujaan sanotaan. 5.1 Taustaa

5. Johdatus faktorikokeisiin. Tekijän omaa vaikutusta vastemuuttujaan sanotaan. 5.1 Taustaa 5. Johdatus faktorikokeisiin 5.1 Taustaa Faktorikokeilla tarkoitetaan koesuunnitelmaa, jossa koe toistetaan kaikilla faktoreiden tasojen kombninaatioilla. Täten, jos faktorilla A on a tasoa ja faktorilla

Lisätiedot

Lähtökohta: k faktoria, kullakin kaksi tasoa ("high", "low"). tulee katettua (complete replicate). Havaintojen

Lähtökohta: k faktoria, kullakin kaksi tasoa (high, low). tulee katettua (complete replicate). Havaintojen 6. 2 k faktorikokeet Lähtökohta: k faktoria, kullakin kaksi tasoa ("high", "low"). Vähintään 2 k havaintoa, jotta kaikki vaihtoehdot tulee katettua (complete replicate). Havaintojen kokonaismäärä N = 2

Lisätiedot