Tilastollinen vastepintamallinnus: kokeiden suunnittelu, regressiomallin analyysi, ja vasteen optimointi Esimerkit laskettu JMP:llä Antti Hyttinen Tampereen teknillinen yliopisto 29.12.2003
ii Ohjelmien versiotietoja: JMP: 5.0.1.2
Luku 1 Regressio 1.1 Matriisilaskentaa ja multinormaalijakauma Ei esimerkkiä. 1.2 Lineaarinen regressiomalli Laskut voidaan tehdä JMP-ohjelmalla seuraavasti. Uusi taulu saadaan valitsemalla File New.Kirjoitetaan data tauluun: Sitten valitaan Analyze Fit Model ja annetaan faktorit ja vaste: 1
2 LUKU 1. REGRESSIO Sitten Run Model antaa halutut parametrit (ja paljon muuta): Matriisi C ei tule näkyviin, mutta korrelaatiomatriisik,joka lasketaanc:stä kaavasta k ij = c ij cii cjj saadaan valitsemalla Response Y:n viereisestä valikosta Estimates Correlation of Estimates. Samasta valikosta saadaan mallin muodostama pinta valitsemalla Factor Profiling Contour Profiler.
1.2. LINEAARINEN REGRESSIOMALLI 3 Ennustetut datan vasteen arvot ŷ saadaan näkyville kopioimalla malli tauluun valitsemalla Response Y:n viereisestä valikosta Save Columns Prediction Formula. Residuaali kopioidaan puolestaan valitsemalla Save Columns Residuals.Estimoitu standardivirhe kopioidaan valitsemalla Save Columns StdErr Pred Formula. Sitten kirjoitetaan halutut faktorit uudelle taulun riville ja ohjelma laskee vaste-ennusteen:
4 LUKU 1. REGRESSIO
1.3. HYPOTEESIEN TESTAAMINEN 5 1.3 Hypoteesien testaaminen JMP-ohjelmalla mallin sovitus ja testaus suoritetaan seuraavasti. Data kirjoitetaan tauluun kuten 1.2 kohdan esimerkissä. Sitten Analyze Fit Model. Faktori X1*X2 saadaan malliin aktivoimalla Select Columns -listasta X1 ja X2, jonka jälkeen painetaancross. X2*X2 saadaan aktivoimallax2 sekä Select Columns että Construct Model Effects -listoista, jonka jälkeen Cross. Viimeinen faktori syntyy kun X2 aktivoidaanselect Columns -listasta jax1*x2 Construct Model Effects -listasta, jonka jälkeen Cross.Jotta faktorit tulisivat malliin sellaisenaan on poistettava optio, joka vähentäätoisen tai korkeamman asteen faktorien termeistä niiden keskiarvot. Tämä onnistuu valitsemalla Model Specification:n viereisestä valikosta Center Polynomials. Sitten Run Model.
6 LUKU 1. REGRESSIO Lopuksi kuva saadaan Response Y:n viereisestä valikosta valitsemalla Factor Profiling Contour Profiler.
1.4. MALLIN EPÄSOPIVUUDEN TESTAUS TOISTOKOKEIN 7 1.4 Mallin epäsopivuuden testaus toistokokein JMP tulostaa varianssianalyysitaulun automaattisesti regressioanalyysia suoritettaessa (joka siis tehdään kuten kohdan 1.2 esimerkissä), mikäli datassa on toistoja ja SSLOF:lla on vapausasteita ainakin yksi. JMP:n tulostus antaa myös suureen Max RSq, joka kertoo kuinka suureen determinaatiokertoimeen R 2 päästäisiin nykyisistämuuttujista(tässä x 1 ja x 2 )muodostettuja faktoreita lisäämällä. Suure lasketaan kaavasta: Max RSq =1 SSPE SST. Huomaa, että kohdan 1.3. esimerkissä onkin päästy determinaatiokertoimen R 2 arvoon 0.991697.
8 LUKU 1. REGRESSIO 1.5 Mallin riittävyys Kun mallin sovitus on suoritettu uudelleen järjestetyllädatalla, residuaalin kuvaajan ennustetun vasteen tai järjestyksen funktiona saa Response Y:n vierestä valitsemalla Row Diagnostics Plot Residual by Predicted tai Plot Residual by Row. Residuaali kopioidaan tauluun valitsemalla Response Y:n vierestä Save Columns Residuals. Kun halutaan tarkistaa ulkolaiset saadaan studentoitu residuaali kopioitua tauluun valitsemalla Response Y:n vierestä Save Columns Studentized Residuals.
1.5. MALLIN RIITTÄVYYS 9 Residuaalin jakaumaa tarkastellaan valitsemalla Analyze Distribution. Valitaan oikea sarake jaok.saadussa ikkunassa Residual Y:n viereisestä valikosta valitaan Normal Quantile Plot. Normaalitodennäköisyyskuviossa akselit ovat erilailla kuin Matlabissa.
10 LUKU 1. REGRESSIO
Luku 2 KOESUUNNITTELUT 2.1 Datan muunnokset JMP-ohjelmalla standardointi ja koodaus tapahtuvat toisiinsa nähden hiukan eri tavalla. Standardointi onnistuu kun luodaan uudet sarakkeet, joihin lasketaan arvot standardointikaavan avulla. Sarakkeen ominaisuuksiin päästään kaksoisklikkaamalla otsikkoa. Sieltä valitaan New Property Formula: Sitten Edit Formula ja syötetään kaava. Standardoinnin kaava löytyy valmiiksiohjelmointuna Statistical Col Standardize: 11
12 LUKU 2. KOESUUNNITTELUT Kunsama menettely on toistettu faktorille x 2 näkyy taulussa standardoinnin tulos: Mallin sovitus kuten aikaisemmin, Analyze Fit Model ja faktorien valinta:
2.1. DATAN MUUNNOKSET 13 Mallin tulostuksessa on laitettu myös näkyviin Correlation of Estimates, josta standardoinnin hyötyjä voi tarkastella: Koodaus tapahtuu automaattisesti kun alkuperäisen datan sarakkeen ominaisuuksista valitaan New Property Coding: Kun sama on tehty myös faktorin x 2 arvoille, sujuu mallin sovitus tuttuun tapaan, josta tulostus:
14 LUKU 2. KOESUUNNITTELUT
2.2. ORTOGONAALISUUS JA KIERTOSYMMETRISYYS 15 2.2 Ortogonaalisuus ja kiertosymmetrisyys JMP-ohjelmassa ortogonaalisuuden näkee korrelaatiomatriiseista (alkuperäinen, standardoitu ja koodattu data): Kiertosymmetrisyys ei näy korrelaatiomatriisista, eikä sitäsaamuutenkaan helposti näkyviin.
16 LUKU 2. KOESUUNNITTELUT 2.3 Simplex-koe Simplex-suunnittelua ei JMP anna. Plackett-Burman suoritetaan seuraavasti. Valitaan DOE Screening Design ja lisätään 9 jatkuvaa faktoria. Sitten Continue ja suunnittelun valinta. Ja taas Continue.
2.3. SIMPLEX-KOE 17 Codes-kohdassa näkyy suunnittelu koodeina ( vastaa 1:tä ja +1:tä). Datamatriisin ensimmäistä, vakiota vastaavaa saraketta ei näytetä.
18 LUKU 2. KOESUUNNITTELUT Make Table antaa suunnittelun tauluna.
2.3. SIMPLEX-KOE 19 Huomaa, ettäkyseinen suunnittelu on eri kuin Matlabilla suoritettu. Erilaisia 20 20 Hadamardin matriiseja on monia. Toisaalta sarakkaiden valinnan voi suorittaa monella eri tavalla. Ortogonaalisuus säilyy valinnasta riippumatta, mutta muut kriteerit, kuten esimerkiksi kattavuus saattaa muuttua.
20 LUKU 2. KOESUUNNITTELUT 2.4 Kahden tason kokeet Valitaan DOE Screening Design ja lisätään malliin 5 jatkuvaa faktoria: Sitten Continue.Valitaan haluttu suunnittelu ja taas Continue. Oletuksena JMP antaa suunnittelun, jossa on kielletty faktorit x 1 x 2 x 3 x 4 ja
2.4. KAHDEN TASON KOKEET 21 x 2 x 3 x 5.Huomaa, että kun faktorien järjestys muutetaan esimerkiksi 1, 2, 3, 4, 5 5, 3, 4, 2, 1 ja järjestetään kokeet uudelleen, suunnittelu on sama kuin aikaisemmin. Vaihdetaan mallin generointisäännöt kiellettyjen faktorien x 1 x 2 x 4, x 1 x 3 x 5 mukaiseksi. Säännöt vaikuttavat Apply:n jälkeen.
22 LUKU 2. KOESUUNNITTELUT Nyt koodit vastaavat esimerkin alun datamatriisia.
2.4. KAHDEN TASON KOKEET 23 Make Table antaa taulun sunnittelusta.
24 LUKU 2. KOESUUNNITTELUT 2.5 Toisen kertaluvun regressiomalli Ei laskettu JMP:llä. 2.6 CCD-kokeet JMP:ssä CCD-kokeen suunnittelu tapahtuu kätevästi. Valitaan DOE Response Surface Design. Suunnittelussa on automaattisesti 2 faktoria. Continue:n jälkeen päästään valitsemaan suunnittelua. Valitaan CCD-Orthogonal ja Continue. Seuraavassa ruudussa voidaan tarkastella valintoja. Samoista α-arvoista (eli Axial Value) huomataan, ettäsuunnittelu on myös kiertosymmetrinen.
2.6. CCD-KOKEET 25 Make Table antaa suunnittelun tauluna. Aksiaaliosa on eri järjestyksessä.
26 LUKU 2. KOESUUNNITTELUT 2.7 Optimaaliset kokeet Ei laskettu JMP:llä.
Luku 3 VASTEEN OPTIMOINTI 3.1 Gradienttimenetelmä JMP:llä onkätevä ensin toteuttaa kahden tason täydellinen koesuunnittelu. Tämä tapahtuu valitsemalla DOE Screening Design.Käyttöalueet kannattaa määrittää faktoreihin, jolloin JMP antaa suoraan suoritettavien kokeiden tasot. Make Table antaa suunnittelun taulun. Vasteen paikalle kirjoitetaan kokeissa saadut arvot. 27
28 LUKU 3. VASTEEN OPTIMOINTI Sitten sovitetaan malli kuten ennenkin. Koodausta ei tarvitse erikseen sarakkeille valita, se tapahtuu automaattisesti. JMP antaa lähes kaiken tarpeellisen. Toisen vaiheen koesuunnittelu sujuu kuten ensimmäinenkin.
3.1. GRADIENTTIMENETELMÄ 29
30 LUKU 3. VASTEEN OPTIMOINTI 3.2 Ääriarvotarkastelu Ensimmäisen kertaluvun mallin sovitus sujuu kuten ennenkin, josta tuloste. Toisen kertaluvun mallille kannattaa ensin tehdä CCD-koesuunnittelu, jolloin kaikki sujuu lähes automaattisesti. Valitaan DOE Response Surface Design ja syötetään tarvittavat tiedot.
3.2. ÄÄRIARVOTARKASTELU 31 Make Table antaa taulun johon kirjoitetaan suoritetuissa kokeissa saadut vasteen arvot. Sitten Analyze Fit Model.Malli on määritelty valmiiksi.
32 LUKU 3. VASTEEN OPTIMOINTI Run Model:in jälkeen pääsemme tarkastelemaan tuloksia. Tulosteessa näkyy automaattisesti maksimipiste, vaste ja vielä kanonisen muodon kertoimet (ominaisarvot) ja pääakselien suunnatkin (ominaisvektorit).
3.2. ÄÄRIARVOTARKASTELU 33
34 LUKU 3. VASTEEN OPTIMOINTI 3.3 Harjuanalyysi Ei laskettu JMP:llä.