Tilastollinen vastepintamallinnus: kokeiden suunnittelu, regressiomallin analyysi, ja vasteen optimointi. Esimerkit laskettu JMP:llä



Samankaltaiset tiedostot
Tässä harjoituksessa käydään läpi R-ohjelman käyttöä esimerkkidatan avulla. eli matriisissa on 200 riviä (havainnot) ja 7 saraketta (mittaus-arvot)

Moniulotteisia todennäköisyysjakaumia. Moniulotteisia todennäköisyysjakaumia. Moniulotteisia todennäköisyysjakaumia: Mitä opimme?

Keskipisteen lisääminen 2 k -faktorikokeeseen (ks. Montgomery 9-6)

Moniulotteisia todennäköisyysjakaumia

Johdatus todennäköisyyslaskentaan Moniulotteisia todennäköisyysjakaumia. TKK (c) Ilkka Mellin (2005) 1

Matriisit ovat matlabin perustietotyyppejä. Yksinkertaisimmillaan voimme esitellä ja tallentaa 1x1 vektorin seuraavasti: >> a = 9.81 a = 9.

Ilkka Mellin Todennäköisyyslaskenta Osa 3: Todennäköisyysjakaumia Moniulotteisia todennäköisyysjakaumia

1. PÄÄTTELY YHDEN SELITTÄJÄN LINEAARISESTA REGRESSIOMALLISTA

Sisällysluettelo 6 REGRESSIOANALYYSI. Metsämuuronen: Monimuuttujamenetelmien perusteet SPSS-ympäristössä ALKUSANAT... 4 ALKUSANAT E-KIRJA VERSIOON...

1. Lineaarialgebraa A := Matriisin osia voidaan muutella päivittämällä riviä, saraketta tai osamatriisia (Matlabmaisesti): B :=

TILASTOLLINEN KOKEIDEN SUUNNITTELU JA OTANTA. Keijo Ruohonen

Harjoitusten 5 vastaukset

Sovellettu todennäköisyyslaskenta B

Valitse ruudun yläosassa oleva painike Download Scilab.

ATH-koulutus: R ja survey-kirjasto THL ATH-koulutus / Tommi Härkänen 1

Laskuharjoitus 9, tehtävä 6

Regressioanalyysi. Kuusinen/Heliövaara 1

SEM1, työpaja 2 ( )

805324A (805679S) Aikasarja-analyysi Harjoitus 4 (2016)

MICROSOFT EXCEL 2010

4.1 Frekvenssijakauman muodostaminen tietokoneohjelmilla

Regressioanalyysi. Vilkkumaa / Kuusinen 1

Mat Tilastollisen analyysin perusteet, kevät 2007

MS-A0204 Differentiaali- ja integraalilaskenta 2 (ELEC2) Luento 7: Pienimmän neliösumman menetelmä ja Newtonin menetelmä.

Tilastolliset ohjelmistot A. Pinja Pikkuhookana

Tilastollisen analyysin perusteet Luento 9: Moniulotteinen lineaarinen. regressio

Harjoitus 9: Excel - Tilastollinen analyysi

Excelin käyttö mallintamisessa. Regressiosuoran määrittäminen. Käsitellään tehtävän 267 ratkaisu.

Usean selittävän muuttujan regressioanalyysi

1 Kertaus. Lineaarinen optimointitehtävä on muotoa:

Lineaarialgebra ja differentiaaliyhtälöt Harjoitus 4 / Ratkaisut

Kanta ja Kannan-vaihto

17 BUDJETOINTI. Asiakaskohtainen Budjetti Ylläpito-ohjelma. Dafo Versio 10 BUDJETOINTI. Käyttöohje. BudgCust Yleistä

VARIANSSIANALYYSI ANALYSIS OF VARIANCE

Jakaumien merkitys biologisissa havaintoaineistoissa: Löytyykö ratkaisu Yleistetyistä Lineaarisista (Seka)Malleista?

(d) Laske selittäjään paino liittyvälle regressiokertoimelle 95 %:n luottamusväli ja tulkitse tulos lyhyesti.

Matematiikka B2 - Avoin yliopisto

Harjoitus 6 -- Ratkaisut

54. Tehdään yhden selittäjän lineaarinen regressioanalyysi, kun selittäjänä on määrällinen muuttuja (ja selitettävä myös):

Harha mallin arvioinnissa

Ratkaisuehdotukset LH 3 / alkuvko 45

, Määrälliset tutkimusmenetelmät 2 4 op

Yleistetyistä lineaarisista malleista

USEAN MUUTTUJAN REGRESSIOMALLIT JA NIIDEN ANA- LYYSI

HSC-ohje laskuharjoituksen 1 tehtävälle 2

SIMULINK 5.0 Harjoitus. Matti Lähteenmäki

Käänteismatriisin ominaisuuksia

Vaatimusten versiointi DOORSissa

Residuaalit. Residuaalit. UK Ger Fra US Austria. Maat

Harjoitus 2 -- Ratkaisut

6. Luennon sisältö. Lineaarisen optimoinnin duaaliteoriaa

4 Riippuvuus 1. Esimerkki 4. Korrelaation laskeminen SPSS-ohjelmalla rajatusta aineistosta

Tilastokeskuksen rajapintapalveluiden käyttöönotto ArcGISohjelmistossa

Tässä dokumentissa on ensimmäisten harjoitusten malliratkaisut MATLABskripteinä. Voit kokeilla itse niiden ajamista ja toimintaa MATLABissa.

Tyyppi metalli puu lasi työ I II III

Tilastollinen vastepintamallinnus: kokeiden suunnittelu, regressiomallin analyysi ja vasteen optimointi

Kuvaajien piirtäminen OriginPro9-ohjelmalla

Summamuuttujat, aineiston pilkkominen ja osa-aineiston poiminta 1

SPSS-perusteet. Sisältö

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

SPSS ohje. Metropolia Business School/ Pepe Vilpas

Matematiikka B2 - TUDI

Harjoitus 2 -- Ratkaisut

Matematiikan tukikurssi

I. Ristiintaulukointi Excelillä / Microsoft Office 2010

4. Lasketaan transienttivirrat ja -jännitteet kuvan piiristä. Piirielimien arvot ovat C =

Ohjelmoinnin peruskurssi Y1

Johdatus tilastotieteeseen Yleinen lineaarinen malli. TKK (c) Ilkka Mellin (2004) 1

Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt: Mitä opimme? Latinalaiset neliöt

Kohdeyleisö: toisen vuoden teekkari

Moottorin kierrosnopeus Tämän harjoituksen jälkeen:

Harjoitus 3: Regressiomallit (Matlab)

YKSIKÖT Tarkista, että sinulla on valittuna SI-järjestelmä. Math/Units Ohjelma tulostaa/käyttää laskennassaan valittua järjestelmää.

1 Funktiot, suurin (max), pienin (min) ja keskiarvo

Tilastotoiminnot. Seuraavien kahden esimerkin näppäinohjeet on annettu kunkin laskinmallin kohdalla:

Insinöörimatematiikka D

MS-A0004/A0006 Matriisilaskenta

1. HARJOITUS harjoitus3_korjaus.doc

3 Lineaariset yhtälöryhmät ja Gaussin eliminointimenetelmä

Sovellettu todennäköisyyslaskenta B

Juha Haataja

Luento 7 Taulukkolaskennan edistyneempiä piirteitä Aulikki Hyrskykari

Mat Tilastollisen analyysin perusteet, kevät 2007

Koesuunnittelu Vastepintamenetelmä. TKK (c) Ilkka Mellin (2005) 1

1 Matriisit ja lineaariset yhtälöryhmät

2 k -faktorikokeet. Vilkkumaa / Kuusinen 1

Tilastollinen vastepintamallinnus: kokeiden suunnittelu, regressiomallin analyysi, ja vasteen optimointi. Esimerkit laskettu Matlabilla

Matriisilaskenta Laskuharjoitus 5 - Ratkaisut / vko 41

KAAVAT. Sisällysluettelo

Ohjelmoinnin perusteet Y Python

Differentiaali- ja integraalilaskenta 2 (CHEM) MS-A0207 Hakula/Vuojamo Kurssitentti, 12.2, 2018, arvosteluperusteet

3 Lineaariset yhtälöryhmät ja Gaussin eliminointimenetelmä

Yhden selittäjän lineaarinen regressiomalli (jatkoa) Ensi viikolla ei pidetä luentoa eikä harjoituksia. Heliövaara 1

Johdatus regressioanalyysiin. Heliövaara 1

Matriisilaskenta (TFM) MS-A0001 Hakula/Vuojamo Ratkaisut, Viikko 47, 2017

Harjoitus 1: Matlab. Harjoitus 1: Matlab. Mat Sovelletun matematiikan tietokonetyöt 1. Syksy 2006

5 Osa 5: Ohjelmointikielen perusteita

2.8. Kannanvaihto R n :ssä

Näillä sivuilla Tilastomatematiikan esimerkit, joissa käsitellään tietokoneen käyttöä tilastollissa operaatioissa, on tehty Excel versiolla.

Insinöörimatematiikka D

Transkriptio:

Tilastollinen vastepintamallinnus: kokeiden suunnittelu, regressiomallin analyysi, ja vasteen optimointi Esimerkit laskettu JMP:llä Antti Hyttinen Tampereen teknillinen yliopisto 29.12.2003

ii Ohjelmien versiotietoja: JMP: 5.0.1.2

Luku 1 Regressio 1.1 Matriisilaskentaa ja multinormaalijakauma Ei esimerkkiä. 1.2 Lineaarinen regressiomalli Laskut voidaan tehdä JMP-ohjelmalla seuraavasti. Uusi taulu saadaan valitsemalla File New.Kirjoitetaan data tauluun: Sitten valitaan Analyze Fit Model ja annetaan faktorit ja vaste: 1

2 LUKU 1. REGRESSIO Sitten Run Model antaa halutut parametrit (ja paljon muuta): Matriisi C ei tule näkyviin, mutta korrelaatiomatriisik,joka lasketaanc:stä kaavasta k ij = c ij cii cjj saadaan valitsemalla Response Y:n viereisestä valikosta Estimates Correlation of Estimates. Samasta valikosta saadaan mallin muodostama pinta valitsemalla Factor Profiling Contour Profiler.

1.2. LINEAARINEN REGRESSIOMALLI 3 Ennustetut datan vasteen arvot ŷ saadaan näkyville kopioimalla malli tauluun valitsemalla Response Y:n viereisestä valikosta Save Columns Prediction Formula. Residuaali kopioidaan puolestaan valitsemalla Save Columns Residuals.Estimoitu standardivirhe kopioidaan valitsemalla Save Columns StdErr Pred Formula. Sitten kirjoitetaan halutut faktorit uudelle taulun riville ja ohjelma laskee vaste-ennusteen:

4 LUKU 1. REGRESSIO

1.3. HYPOTEESIEN TESTAAMINEN 5 1.3 Hypoteesien testaaminen JMP-ohjelmalla mallin sovitus ja testaus suoritetaan seuraavasti. Data kirjoitetaan tauluun kuten 1.2 kohdan esimerkissä. Sitten Analyze Fit Model. Faktori X1*X2 saadaan malliin aktivoimalla Select Columns -listasta X1 ja X2, jonka jälkeen painetaancross. X2*X2 saadaan aktivoimallax2 sekä Select Columns että Construct Model Effects -listoista, jonka jälkeen Cross. Viimeinen faktori syntyy kun X2 aktivoidaanselect Columns -listasta jax1*x2 Construct Model Effects -listasta, jonka jälkeen Cross.Jotta faktorit tulisivat malliin sellaisenaan on poistettava optio, joka vähentäätoisen tai korkeamman asteen faktorien termeistä niiden keskiarvot. Tämä onnistuu valitsemalla Model Specification:n viereisestä valikosta Center Polynomials. Sitten Run Model.

6 LUKU 1. REGRESSIO Lopuksi kuva saadaan Response Y:n viereisestä valikosta valitsemalla Factor Profiling Contour Profiler.

1.4. MALLIN EPÄSOPIVUUDEN TESTAUS TOISTOKOKEIN 7 1.4 Mallin epäsopivuuden testaus toistokokein JMP tulostaa varianssianalyysitaulun automaattisesti regressioanalyysia suoritettaessa (joka siis tehdään kuten kohdan 1.2 esimerkissä), mikäli datassa on toistoja ja SSLOF:lla on vapausasteita ainakin yksi. JMP:n tulostus antaa myös suureen Max RSq, joka kertoo kuinka suureen determinaatiokertoimeen R 2 päästäisiin nykyisistämuuttujista(tässä x 1 ja x 2 )muodostettuja faktoreita lisäämällä. Suure lasketaan kaavasta: Max RSq =1 SSPE SST. Huomaa, että kohdan 1.3. esimerkissä onkin päästy determinaatiokertoimen R 2 arvoon 0.991697.

8 LUKU 1. REGRESSIO 1.5 Mallin riittävyys Kun mallin sovitus on suoritettu uudelleen järjestetyllädatalla, residuaalin kuvaajan ennustetun vasteen tai järjestyksen funktiona saa Response Y:n vierestä valitsemalla Row Diagnostics Plot Residual by Predicted tai Plot Residual by Row. Residuaali kopioidaan tauluun valitsemalla Response Y:n vierestä Save Columns Residuals. Kun halutaan tarkistaa ulkolaiset saadaan studentoitu residuaali kopioitua tauluun valitsemalla Response Y:n vierestä Save Columns Studentized Residuals.

1.5. MALLIN RIITTÄVYYS 9 Residuaalin jakaumaa tarkastellaan valitsemalla Analyze Distribution. Valitaan oikea sarake jaok.saadussa ikkunassa Residual Y:n viereisestä valikosta valitaan Normal Quantile Plot. Normaalitodennäköisyyskuviossa akselit ovat erilailla kuin Matlabissa.

10 LUKU 1. REGRESSIO

Luku 2 KOESUUNNITTELUT 2.1 Datan muunnokset JMP-ohjelmalla standardointi ja koodaus tapahtuvat toisiinsa nähden hiukan eri tavalla. Standardointi onnistuu kun luodaan uudet sarakkeet, joihin lasketaan arvot standardointikaavan avulla. Sarakkeen ominaisuuksiin päästään kaksoisklikkaamalla otsikkoa. Sieltä valitaan New Property Formula: Sitten Edit Formula ja syötetään kaava. Standardoinnin kaava löytyy valmiiksiohjelmointuna Statistical Col Standardize: 11

12 LUKU 2. KOESUUNNITTELUT Kunsama menettely on toistettu faktorille x 2 näkyy taulussa standardoinnin tulos: Mallin sovitus kuten aikaisemmin, Analyze Fit Model ja faktorien valinta:

2.1. DATAN MUUNNOKSET 13 Mallin tulostuksessa on laitettu myös näkyviin Correlation of Estimates, josta standardoinnin hyötyjä voi tarkastella: Koodaus tapahtuu automaattisesti kun alkuperäisen datan sarakkeen ominaisuuksista valitaan New Property Coding: Kun sama on tehty myös faktorin x 2 arvoille, sujuu mallin sovitus tuttuun tapaan, josta tulostus:

14 LUKU 2. KOESUUNNITTELUT

2.2. ORTOGONAALISUUS JA KIERTOSYMMETRISYYS 15 2.2 Ortogonaalisuus ja kiertosymmetrisyys JMP-ohjelmassa ortogonaalisuuden näkee korrelaatiomatriiseista (alkuperäinen, standardoitu ja koodattu data): Kiertosymmetrisyys ei näy korrelaatiomatriisista, eikä sitäsaamuutenkaan helposti näkyviin.

16 LUKU 2. KOESUUNNITTELUT 2.3 Simplex-koe Simplex-suunnittelua ei JMP anna. Plackett-Burman suoritetaan seuraavasti. Valitaan DOE Screening Design ja lisätään 9 jatkuvaa faktoria. Sitten Continue ja suunnittelun valinta. Ja taas Continue.

2.3. SIMPLEX-KOE 17 Codes-kohdassa näkyy suunnittelu koodeina ( vastaa 1:tä ja +1:tä). Datamatriisin ensimmäistä, vakiota vastaavaa saraketta ei näytetä.

18 LUKU 2. KOESUUNNITTELUT Make Table antaa suunnittelun tauluna.

2.3. SIMPLEX-KOE 19 Huomaa, ettäkyseinen suunnittelu on eri kuin Matlabilla suoritettu. Erilaisia 20 20 Hadamardin matriiseja on monia. Toisaalta sarakkaiden valinnan voi suorittaa monella eri tavalla. Ortogonaalisuus säilyy valinnasta riippumatta, mutta muut kriteerit, kuten esimerkiksi kattavuus saattaa muuttua.

20 LUKU 2. KOESUUNNITTELUT 2.4 Kahden tason kokeet Valitaan DOE Screening Design ja lisätään malliin 5 jatkuvaa faktoria: Sitten Continue.Valitaan haluttu suunnittelu ja taas Continue. Oletuksena JMP antaa suunnittelun, jossa on kielletty faktorit x 1 x 2 x 3 x 4 ja

2.4. KAHDEN TASON KOKEET 21 x 2 x 3 x 5.Huomaa, että kun faktorien järjestys muutetaan esimerkiksi 1, 2, 3, 4, 5 5, 3, 4, 2, 1 ja järjestetään kokeet uudelleen, suunnittelu on sama kuin aikaisemmin. Vaihdetaan mallin generointisäännöt kiellettyjen faktorien x 1 x 2 x 4, x 1 x 3 x 5 mukaiseksi. Säännöt vaikuttavat Apply:n jälkeen.

22 LUKU 2. KOESUUNNITTELUT Nyt koodit vastaavat esimerkin alun datamatriisia.

2.4. KAHDEN TASON KOKEET 23 Make Table antaa taulun sunnittelusta.

24 LUKU 2. KOESUUNNITTELUT 2.5 Toisen kertaluvun regressiomalli Ei laskettu JMP:llä. 2.6 CCD-kokeet JMP:ssä CCD-kokeen suunnittelu tapahtuu kätevästi. Valitaan DOE Response Surface Design. Suunnittelussa on automaattisesti 2 faktoria. Continue:n jälkeen päästään valitsemaan suunnittelua. Valitaan CCD-Orthogonal ja Continue. Seuraavassa ruudussa voidaan tarkastella valintoja. Samoista α-arvoista (eli Axial Value) huomataan, ettäsuunnittelu on myös kiertosymmetrinen.

2.6. CCD-KOKEET 25 Make Table antaa suunnittelun tauluna. Aksiaaliosa on eri järjestyksessä.

26 LUKU 2. KOESUUNNITTELUT 2.7 Optimaaliset kokeet Ei laskettu JMP:llä.

Luku 3 VASTEEN OPTIMOINTI 3.1 Gradienttimenetelmä JMP:llä onkätevä ensin toteuttaa kahden tason täydellinen koesuunnittelu. Tämä tapahtuu valitsemalla DOE Screening Design.Käyttöalueet kannattaa määrittää faktoreihin, jolloin JMP antaa suoraan suoritettavien kokeiden tasot. Make Table antaa suunnittelun taulun. Vasteen paikalle kirjoitetaan kokeissa saadut arvot. 27

28 LUKU 3. VASTEEN OPTIMOINTI Sitten sovitetaan malli kuten ennenkin. Koodausta ei tarvitse erikseen sarakkeille valita, se tapahtuu automaattisesti. JMP antaa lähes kaiken tarpeellisen. Toisen vaiheen koesuunnittelu sujuu kuten ensimmäinenkin.

3.1. GRADIENTTIMENETELMÄ 29

30 LUKU 3. VASTEEN OPTIMOINTI 3.2 Ääriarvotarkastelu Ensimmäisen kertaluvun mallin sovitus sujuu kuten ennenkin, josta tuloste. Toisen kertaluvun mallille kannattaa ensin tehdä CCD-koesuunnittelu, jolloin kaikki sujuu lähes automaattisesti. Valitaan DOE Response Surface Design ja syötetään tarvittavat tiedot.

3.2. ÄÄRIARVOTARKASTELU 31 Make Table antaa taulun johon kirjoitetaan suoritetuissa kokeissa saadut vasteen arvot. Sitten Analyze Fit Model.Malli on määritelty valmiiksi.

32 LUKU 3. VASTEEN OPTIMOINTI Run Model:in jälkeen pääsemme tarkastelemaan tuloksia. Tulosteessa näkyy automaattisesti maksimipiste, vaste ja vielä kanonisen muodon kertoimet (ominaisarvot) ja pääakselien suunnatkin (ominaisvektorit).

3.2. ÄÄRIARVOTARKASTELU 33

34 LUKU 3. VASTEEN OPTIMOINTI 3.3 Harjuanalyysi Ei laskettu JMP:llä.