Mat-.3 Koesuunnittelu ja tilastolliset mallit kevät Keskipisteen lisääminen k -faktorikokeeseen (ks. Montgomery 9-6) Esim (Montg. ex. 9-, 6-): Tutkitaan kemiallisen prosessin saannon Y riippuvuutta faktoreista A = reaktioaika ja B = lämpötila. Faktoreille annetaan seuraavat arvot: A B alataso (-) 3 min o C ylätaso (+) min 6 o C Koesuunnitelmaan kuuluu siis = koetta (jos ei ole toistoja), ja tuloksista voidaan (yleiskeskiarvon µ lisäksi) estimoida parametrit α, β ja αβ, ts. päävaikutukset A ja B sekä yhdysvaikutus AB. Merkitsevyyden testausta ei voida tehdä, koska koevirheelle ei saada estimaattia. Lisätään koesuunnitelmaan n = koetta keskipisteessä (A=3 min, B= o C). Tällöin i) Keskipisteessä mitatuista arvoista y,,..., y, n saadaan varianssiestimaatti, ii) Merkitään Suuri poikkeama y y = keskipistearvojen y,,..., y, n keskiarvo, y = nurkkapistearvojen y(), ya, y b, y ab keskiarvo. y on merkki siitä, että Y:n riippuvuus faktoreista on epälineaarista (esiintyy kaarevuutta = curvature). Tulokset: A B Y () - - 39.3 a -.9 b -. ab..3..7..6 Keskipistearvoista saadaan n =, y =. 6 ja (poikkeamaneliösumma) ss =.7. Nurkkapistearvoista saadaan y =. sekä $α = Eff A / =.77 ja vastaavasti β $ =.3, ( αβ $ ) = -.. Olkoon y = kaikkien havaintojen keskiarvo. Kaikista havainnoista laskettu SS Tot = (y i - y ) hajoaa summaksi SS Tot = SS Mod + SS Err, missä SS Mod = = SS A + SS B + SS AB, ja SS Err hajoaa edelleen muotoon SS Err = SSE LoF +SSE pe, missä
Saadaan ANOVA-taulu SSE pe = ss = ss(keskipistearvot) (pe = pure error) SSE LoF = * y y ) + (vrt. kohta ii) yllä). df SS MS F A..87 erittän merkitsevä B. 9.83 merkitsevä AB..6 ei merkitsevä LoF.7.6 ei merkitsevä pe.7.3 Tot 8 3. Huom:. Keskipistehavainnoilla ei ole vaikutusta estimaattien $α, eikä SS Mod :n komponenttien laskemiseen (esim. SS A = *(Eff A /) jne).. Yo. tarkastelu yleistyy ilman oleellisia muutoksia tilanteeseen, jossa faktoreita on useampia. SS LoF :n yleinen lauseke on SS LoF = n n n + n (y y ), missä n = k n = nurkkapisteissä tehtyjen kokeiden lkm (k = faktorien lkm, n = nurkkapisteissä tehtyjen replikaattien lkm (tässä n = )). 3. Symbolin LoF sijasta käytetään tässä yhteydessä joskus symbolia pq (pure quadratic), siis esim. SS pq jne. Tämä viittaa. asteen regressiopolynomin puhtaasti neliöllisiin termeihin jotka ovat muotoa β ii x i (erotukseksi sekatermeistä β ij x i x j ); ks. jäljempää. Vastepintamenetelmä (RSM = response surface method) Siirrytään merkintöjen A, B, AB,, µ, α, β,... sijasta käyttämään merkintöjä x, x,, β, β, β, β,. Oletetaan, että vaste Y riippuu faktoreista x, x k, kaavan Y = f(x, x k ) + ε mukaisesti, missä ε on -keskiarvoinen satunnaissuure (siis f(x, x k ) = Y:n odotusarvo kohdassa (x, x k )). Pinta (oletetaan yksinkertaisuuden vuoksi k = ) on vastepinta. y = f(x, x )
Riittävän pienessä alueessa x x -tason origon ympärillä pintaa voidaan approksimoida. asteen polynomilla () y = f(x, x ) β + β x + β x tai, jos kaarevuus halutaan huomioida,. asteen polynomilla () y = f(x, x ) β + β x + β x + β x x + β x + β x. Esim. yllä olevassa esimerkissä saatiin. asteen polynomiapproksimaatio y =. +.77x +.3x, missä ξ 3 =, x ξ =, x ξ = reaktioaika, ξ = lämpötila.. asteen malli osoittautui riittäväksi pisteen (ξ, ξ ) = (3, ) läheisyydessä. Oletetaan, että halutaan maksimoida Y:n (odotus)arvo, ts. löytää funktion f maksimikohta. Voidaan käyttää seuraavanlaista strategiaa (vastaavasti tietenkin jos halutaan minimoida f):. Tehdään keskipisteellinen k -faktorikoe (keskipisteessä faktorien nykyiset arvot tai arvattu max-kohta tms.). kaarevuus ei merkitsevää. kaarevuus on merkitsevää 3.. f:ää approksimoidaan lineaarisella mallilla (). Maksimikohdan lähelle pääsemiseksi lähdetään vektorin ( β ˆ,..., ˆ βk ) (joka on estimaatti grad(f):lle) suuntaan. Edetään sopivaa askelpituutta käyttäen tehden joka askeleella yksi mittaus vasteesta Y. Kun Y lakkaa kasvamasta ja alkaa taas vähetä, palataan kohtaan. (keskipisteenä se piste josta saatiin suurin havainto). (Tämä on itse asiassa aivan tavanomainen gradienttimenetelmä.) 3. Ollaan lähellä maksimikohtaa. Tehdään lisää mittauksia (ks. jäljempää) ja sovitetaan. asteen malli () saadaan estimoitua maksimikohta. Esim: vaihe. esitetty edellä vaihe. (Seurataan edelleen Montgomeryn esimerkkiä) Lähtien pisteestä (ξ, ξ ) = = (3, ) siirrytään askeleittain s.e. askel = ( ξ, ξ ) = ( min, o C), ts. (likimain) vektorin ( β ˆ ˆ ) ( ˆ, β = α, βˆ) = (.77,.3) suuntaan. Mitataan Y joka askeleella; oletetaan, että saadaan 3
askel ξ ξ y 3. (=keskiarvo) 7. M M M M 9 8 73 77.6 8 7 8.3 max! 9 77 76. ξ 8 ξ 7 Asetetaan nyt x = ja x = sekä palataan kohtaan. ; oletetaan, että saadaan seuraavat tulokset: x x y - - 76.. asteen malli y = 78.97 +.x +.x - 78. sekä - 77. ANOVA : 79. df SS 79.9 Mod. 8.3 AB. 8. LoF=pq.68 79.7 pe. 79.8 Tot 8 kaarevuus (LoF) on merkitsevää (F-arvo =.) siirrytään kohtaan 3.. asteen polynomin sovitus (vaihe 3.) Täydennetään edellä esitettyä koesarjaa mittaamalla Y vielä pisteissä (x, x ) = = (±α, ) ja (, ± α), missä α > on sopivasti valittu; tavanomaisia arvoja ovat α = : uudet pisteet ovat alkuperäisten k koepisteen muodostaman k-ulotteisen kuution (tässä: neliö) tahkojen keskipisteet, α = n (ns. Box in koesuunnitelma): Voidaan osoittaa, että tällä α:n valinnalla (ja valitsemalla vielä keskipistekokeiden lkm n sopivasti) saadaan kiertosymmetrinen (rotatable) koesuunnitelma, mikä merkitsee, että Var( ŷ ) on vakio origokeskisillä pallopinnoilla. Valitaan Box in koe, ts. α = ; oletetaan että lisämittausten tulokset ovat x x y - 7.6 78. - 77. 78. (siis pisteessä (8, 7) ja sen ympärillä on nyt tehty kaikkiaan + + = 3 mittausta).. asteen regressiomallin () sovittaminen dataan antaa polynomin
y = 79.9 +.99x +.x +.x x -.377x -.x ja ANOVA-taulun df SS MS F Mod 8.6.6 6.63 LoF 3.7.9.73 pe..3 Tot 8.73 LoF on selvästi ei-merkitsevä, joten malli näyttää kuvaavan hyvin Y:n riippuvuutta faktoreista. (Huomaa, että kun nyt on sovitettu. asteen polynomi, LoF ei enää liity kaarevuuteen; malli selittää nyt kaarevuuden. Koska mittauspisteitä on 9 ja mallissa on 6 kerroinparametria, jää yksinkertaisesti 3 vapausastetta LoF:lle.) f f Estimoidaan maksimikohta (ehto = = ) : x x.99 -.377 x +.x =. +.x -. x =, mistä saadaan x =.389, x =.36 eli ξ = 86.9 (min), ξ = 76.3 ( o C). Yleensä stationaarinen piste (grad(f):n -kohta) voi olla maksimi- tai minimikohta tai ei kumpaakaan (satulapiste); stationaarisen pisteen luonne voidaan usein selvittää tutkimalla funktion f Hessin matriisia (jonka elementit ovat f:n. kertaluvun osittaisderivaatat laskettuina asianomaisessa pisteessä); tässä esimerkissä H f =. 7.,.. jonka ominaisarvot ovat λ = -.93 ja λ = -.83. Koska ominaisarvot ovat <, matriisi H f on negatiivisesti definiitti, joten löydetty piste on todella (lokaali) maksimikohta (tehtyjen mittausten valossa).