6. 2 k faktorikokeet. Lähtökohta: k faktoria, kullakin kaksi tasoa ("high", "low"). määrä per faktoritasokombinaatio (balansoidussa)kokeessa.
|
|
- Pauliina Hakala
- 7 vuotta sitten
- Katselukertoja:
Transkriptio
1 6. 2 k faktorikokeet Lähtökohta: k faktoria, kullakin kaksi tasoa ("high", "low"). Vähintään 2 k havaintoa, jotta kaikki vaihtoehdot tulee katettua (complete replicate). Havaintojen kokonaismäärä N =2 k n, jossa n toistojen määrä per faktoritasokombinaatio (balansoidussa)kokeessa. Oletukset: (1) faktorit kiinteitä (fixed factors), (2) asetelma on täysin satunnaistettu (completely randomized design) Esimerkki 6.1: Tarkastellaan seoksen väkevyysasteen (A, prosennteina) ja katalyytin määrän (B, kilogrammoina) vaikutusta kemiallisessa prosessissa saatavan tuotoksen määrään (y, mitattu sopivassa yksikössä). A: 15% ( low = 1 ), 25% ( high = + 1 ) B: 0.5kg ( low = 1 ), 1kg ( high = +1 ). Toistoja: n =3, Data: ============================================================= Toisto Kasittely A B kombinaatio I II III Total A low, B low A high, B low A low, B high A high, B high ============================================================= (3) virhetermi N(0,σ 2 )-jakautunut. Yleisessä tarkastelussa vastemuuttujaa (response variable) merkitään y:llä ja faktoreita A, B, C,
2 Koe on satunnaistettu siten, että jokaisella toistolla permutoidaan ensin rivit satunnaisesti ja tehdään käsittelyt (runs). Matriisia sanotaan designmatriisiksi. Factor Run A B Analyysi toteutetaan kuten edellisessä kappaleessa. SAS-ajo: options ls = 80; data chemicalprocess; input A B label A = "Reactant concentration (15% = low, 25% = high)" B = "Catalyst (0.5kg = low, 1kg = high)" y = "Yield"; datalines; ; run; Title "2ˆ2 factorial example"; proc glm data = chemicalprocess; class A B; model y = A B A*B; run; 3 4
3 Tulokset The GLM Procedure Class Level Information Class Levels Values A B Number of Observations Read 12 Number of Observations Used 12 2ˆ2 factorial example The GLM Procedure Dependent Variable: y Yield Sum of Source DF Squares Mean Square F Value Pr > F Model Error Total R-Square Coeff Var Root MSE y Mean Source DF Type III SS Mean Square F Value Pr > F A <.0001 B A*B Yhdysvaikutus ei ole tilastollisesti merkitsevä, joten se voidaan jättää pois mallista. Kun faktorit ovat kvantitatiivisia, voidaan käyttää myös regressioanalyysia. Tulokseksi saadaan n.s. vastepinta (response surface), jota voidaan käyttää ennustamaan y:n arvoja millä tahansa väkevöitysasteella ja katalyytin määrällä. Jättämällä yhdysvaikutustekijä pois, on estimoitava regressiomlli muotoa (1) y = β 0 + β A A + β B B + ε. proc glm data = chemicalprocess; model y = A B; run; R-Square Coeff Var Root MSE y Mean Parameter Estimate Error t Value Pr > t Intercept A <.0001 B
4 Huom. 6.1: Edellä esitetty designmatriisi on ortogonaalinen (A:n ja B:n sisätulo on nolla). Tällaista koeasetelmaa sanotaan ortogonaaliseksi (toistoja n kappaletta kaikilla faktoritasojen kombinaatioilla). Huom. 6.2: Regressioanalyysi voidaan toteuttaa myös käyttämällä designmatriisin sarakkeita sellaisenaan selittävinä muuttujina. Yhdysvaikutustekijää vastaava selittävä muuttuja on tällöin A B = Esim. 6.2: Määritellään { 1, jos A =15 x 1 = 1, jos A =25 jolloin regressiomalli on x 2 = { 1, jos B =0.5 y = β 0 + β 1 x 1 + β 2 x 2 + β 12 x 1 x 2 + ε. data cp2; * Muodostetaan uusi tiedosto; set chemicalprocess; if (a = 15) then x1 = -1; else x1 = 1; if (b = 1) then x2 = -1; else x2 = 1; run; Title "2ˆ2 factorial as a regression model"; proc glm; model y = x1 x2 x1*x2; run; 1, jos B =1 Laadullisesti kaikki vaihtoehdot (ANOVA, response surface, regression) johtavat samaan tulokseen. 7 8
5 Dependent Variable: y Yield Sum of Source DF Squares Mean Square F Value Pr > F Model Error Corrected R-Square Coeff Var Root MSE y Mean Source DF Type III SS Mean Square F Value Pr > F x <.0001 x x1*x Standard Parameter Estimate Error t Value Pr > t Intercept <.0001 x <.0001 x x1*x Yleinen 2 k malli Yleisessä 2 k faktorikokeen asetelmassa (factorial design) on k päävaikutusta, k 2 ) toisen asteen yhdysvaikutustermiä, ) k kolmannen asteen yhdysvaikutustermiä, 3 yksi k:n tekijän yhdysvaikutustermi. Yhteensä termejäon2 k 1 (yleiskeskiarvon lisäksi). Yhdelläkin toistolla kokeita on tehtävä 2 k kappaletta, jotta kaikki vaihtoehdot tulee testatuksi. 9 10
6 Kokeen toteuttamiseksi laaditaan ensin standardi designmatriisi (standard design matrix), joka saadaan lisäämällä faktori kerrallaan ja yhdistämällä se muihin faktoreihin. Varianssitaulu (toistoja n): Source SS df MS F Esimerkki 6.2: 2 4 faktorikokeen standardi designmatriisi ============================ Factor Row A B C D ============================ ============================ Main effect A SS A 1 MS A MS A Main effect B SS B 1 MS B MS B Main effect C SS C 1 MS C MS C Main effect D SS D 1 MS D MS D Interaction AB SS AB 1 MS AB MS AB Interaction AC SS AC 1 MS AC MS AC Interaction AD SS AD 1 MS AD MS AD Interaction BC SS BC 1 MS BC MS BC Interaction BD SS BD 1 MS BD MS BD Interaction CD SS CD 1 MS CD MS CD Interaction ABC SS ABC 1 MS ABC MS ABC Interaction ABD SS ABD 1 MS ABD MS ABD Interaction ACD SS ACD 1 MS ACD MS ACD Interaction BCD SS BCD 1 MS BCD MS BCD Interaction ABCD SS ABCD 1 MS ABCD MS ABCD Error SS err 2 k (n 1) Total SS tot 2 4 n 1 Satunnaistaminen toteutetaan permutoimalla rivit satunnaiseen järjestykseen
7 Huom. 6.3: Koska pää- ja yhdysvaikutustermien vapausasteet ovat 1, SS ja MS ovat samat. = SS err /[16(n 1)] (2 4 = 16). 2 k kokeen toteutus: 1. Estimoidaan faktoriefektit 2. Muodostetaan perusmalli a) jos toistoja, estimoidaan täysi malli b) jos ei toistoja, valitaan tekijät normaalijakaumatestillä 3. Testataan tekijöiden tilastolliset merkitsevyydet 4. Poistetaan tarpeettomat tekijät ja estimoidaan lopullinen malli 5. Analysoidaan residuaalit 6. Tulkitaan mallin tulokset 13 14
8 Esimerkki 6.3: Nikkelin ja titaniumin seoksesta valmistetun metallin (mm. lentokoneen moottoreissa) murtumat. Taustatekijöitä: A pouring temperature, B titanium content, C heat treatment method ja D amount of grain refiner used. Vastemuuttuja y the length of crack in mm 10 2 induced in a sample coupon subject to a standard test. Toistoja n = 2 jokaisella käsittelykombinaatiolla. Kysymyksessä on2 4 täysin satunnaistettu faktorikoe. Design matriisi, käsittelyjärjestykset ja mittaukset: ==================================================== Run order Replicate A B C D Repl I Repl II I II ===================================================== 15 16
9 SAS-analyysi options ls = 80; data titanium; input /* muodostetaan design matriisi*/ if (mod(int((_n_+1)/2),2)=0) then A = 1; else A = -1; if (mod(int((_n_+1)/2),4)=0) (mod(int((_n_+1)/2)+1,4)=0) then B = 1; else B = -1; if (mod(int((_n_+1)/2),8)=0) (mod(int((_n_+1)/2)+1,8)=0) (mod(int((_n_+1)/2)+2,8)=0) (mod(int((_n_+1)/2)+3,8)=0) then C = 1; else C = -1; if (int((_n_+1)/2) < 9) then D = -1; else D = 1; label y = "Crack length (mm x 10e-2)" A = "Pouring temperature" B = "Titanium content" C = "Heat treatment method" D = "Grain refiner used"; datalines; ; run; Title "Nickel-titan alloy cracks data (2ˆ4 faktorial design)"; proc glm data = titanium; class A B C D; model y = A B C D; run; 17 18
10 Nickel-titan alloy cracks data (2ˆ4 faktorial design) The GLM Procedure Class Level Information Class Levels Values A B C D Number of Observations Read 32 Number of Observations Used 32 Dependent Variable: y The GLM Procedure Crack length (mm x 10e-2) Sum of Source DF Squares Mean Square F Value Pr > F Model <.0001 Error Corrected R-Square Coeff Var Root MSE y Mean Source DF Type III SS Mean Square F Value Pr > F A <.0001 B <.0001 A*B <.0001 C <.0001 A*C <.0001 B*C A*B*C <.0001 D <.0001 A*D B*D A*B*D C*D A*C*D B*C*D A*B*C*D Mikään interaktiotekijä, jossa D on mukana, ei ole tilastollisesti merkitsevä. Kolmannen asteen tekijöistä ABC on tilastollisesti merkitsevä. Yleinen tapa on, että pysytelään hierarkisissa malleissa, jolloin korkeinta astetta olevan termin kaikki alemmat termit säilytetään lopullisessa mallissa. Poistamalla muut tilastollisesti ei-merkitsevät tekijät estimoidaan seuraavaksi malli, jossa on ABC ja kaikki alemman asteen termit sekä D:n päävaikutus (main effect). Regressioestimoinnilla saadaan myös kertoimet. 20
11 Nickel-titan alloy cracks data (2ˆ4 faktorial design) The GLM Procedure Dependent Variable: y Crack length (mm x 10e-2) Sum of Source DF Squares Mean Square F Value Pr > F Model <.0001 Error Corrected Tekijän C, heat treatment method, vaikutus on negatiivinen samoin kuin AC interactioterimin. Tarkastellaan seuraavaksi mallin riittävyyttä. R-Square Coeff Var Root MSE y Mean Source DF Type III SS Mean Square F Value Pr > F A <.0001 B <.0001 A*B <.0001 C <.0001 A*C <.0001 B*C A*B*C <.0001 D <.0001 Normaalisuus on jokseenkin ok, eikä heteroskedastisuutta ole havaittavissa. Standard Parameter Estimate Error t Value Pr > t Intercept <.0001 A <.0001 B <.0001 A*B <.0001 C <.0001 A*C <.0001 B*C A*B*C <.0001 D <
12 Jos tavoitteena on saada seos, jossa murtumat (cracks) ovat mahdollisimman pieniä, löytyy kombinaatio suoraan etsimällä vaihtoehto, jossa keskiarvo on pienin. Yleisessä tapauksessa tämä ja muut vaihtoehdot saadaan ennustettua regressiomallia, jonka kerroinestimaatit on tulostuksen alimmassa taulukossa. Alla on ennusteet eri kombinaatioilla. Minimi löytyy tekijäntasoilla A = 1, B = -1, C = 1, D = -1 y =4.2 ja ˆy 2121 =4.1. Ero (pieni) keskiarvon ja regressioennusteen välillä johtuu siitä, että malli ei ole saturoitu (saturoitu malli = malli, jossa kaikki päävaikutus ja yhdysvaikutustermit) ===================================== A B C D mean(y) pred (y) ==================================== 23 24
13 Jos yhdysvaikutstekijöitä ei huomioitaisi, päävaikutusten ( yksi tekijä kerrallaan asetelma) johtaisi, tilanteeseen, jossa malli ennustaisi parhaan tuloksen käsittelykombinaatiolla A = -1, B = -1, C = 1, D = -1, y pred =5.7, kun tilastollisesti merkitsevät yhdysvaikutusterimit sisältävä malli ennustaa y pred =10.2! Tarkastellaan vielä yhdysvaikutustermejä hieman lähemmin. Tarkastellaan AB, AC, BC ja ABC yhdysvaikutuksia. Erityisesti BC ei ole tilastollisesti merkitsevä. Jos yhdysvaikutusta ei ole, niin kyseisten tekijöiden vaikutus vastemuuttujaan on samansuuntaista (parallel) siiryttäessä käsittelyn tasolta toiselle. Yhdysvaikutuksen tapauksessa profiilien suunnat poikkeavat toisistaan. Profiels of A class means given B treatment Profiels of A class mean profiles given C treatment Profiels of B class mean profiles given C treatment Class mean Class mean Class mean A- A+ B B A- A+ C C B- B+ C C B:n ja C:n välillä ei siis ole yhdysvaikutusta
14 Tarkastellaan seuraavkasi ABC yhdysvaikutusta. BC for A = -1 BC for A = +1 BC for A combined Jos kaikki yllä olevat profiilit olisivat saman samanlaisia, se olisi osoitus ABC yhdysvaikutuksen puuttumisesta. Class mean 10.0 Class mean Class mean Jos kaikki ovat samansuuntaisia, puuttuuvat kaikki yhdysvaikututekijät. 5.0 B- B+ C= C = B- B+ C= C = B- B+ C= C = D:ltä puuttuu kaikki interaktiotermit. Kuviona tämä näyttää seuraavalta. (esimerkiksi BD ja ABD). A:n luokissa B:n keskiarvoprofiilit eivät ole saman suun BD for A = BD for A = BD for A combined taisia, kun taas aggregoitaessa A:n yli, profiilit ovat samansuuntaisest (viimeinen kuvio oikealla, joka on sama kuin BC-kuvio edellä). Class mean 10.0 Class mean 10.0 Class mean B- B+ 5.0 B- B+ 5.0 B- B+ Tämä on osoitus kolmannen asteen iteraktiosta (ABC). D= D = D= D = D= D =
15 2 k asetelma: yksi toisto (n =1) Faktoreiden lukumäärän k kasvaessa, kasvaa käsittelyykombinaatioiden määrä nopeasti. Esimerkiksi, jos k = 5, niin 2 5 = 32 kombinaatiota, jos k = 6, niin 2 6 = 64 kombinaatiota. Tällaisissa tapauksissa turvaudutaan usien vain yhteen toistoon (n =1). Kuitenkin, jos korkeimpien asteiden yhdysvaikutuksia ei esiinny voidaan niiden vapausasteet käyttää residuaalivarianssin estimointiin. Normaalijakauman todennäköisyyskuviota (normal probability plot) voidaan käyttää päättämään minkä termien estimaatit ovat katsottavissa pelkästään satunnaisvaihteluksi (satunnaiskohinaksi). Täyden mallin (saturated) yhdysvaikutusten testausta ei tällöin voida toteuttaa, koska residuaalivarianssin estimoimiseksi ei riitä vapausasteita
16 Esimerkki 6.4: Kemiallista tuotetta valmistetaan paineastiassa suodattamalla. Tavoiteena on parantaa suodatusnopeutta nykyisestä n. 75 gal/h. Faktorikokeella tutkitaan suodatusnopeuteen vaikuttavia tekijöitä. Vastemuuttuja: y: suodatusnopeus (filtration rate gal/h) Faktorit: Havainnot: ================ A B C D y ================ A: Lämpötila (temperature) B: Paine (pressure) C: Formalehydikonsentraatio (concentration of formaldehyde) D: Sekoitusnopeus? (stirring rate) 31 32
17 Regressiokerroinestimaatit: ========================== Parameter Estimate Intercept A B A*B C A*C B*C A*B*C D A*D B*D A*B*D C*D A*C*D B*C*D A*B*C*D ========================== Kerroinestimaattien Normal probability plot: Standardized Normla Variate 3 2 A 1 AD D C AC Effect estimate Suoralla olevat kertoimet ovat tilastollisesti merkityksettömiä. Estimoidaan malli, jossa on tekijöiden A, C ja D päävaikutukset sekä yhdysvaikututermit AC ja AD
18 Erityisesti, koska B eikä mitkään siihen liittyvät yhdysvaikutustermit osoittaudu tilastollisesti merkittäviksi, jää B kokonaisuudessaan pois. Tällöin koetilanne voidaan itse asiassa ajatella 2 3 asetelmana, jossa muodostuu kaksi toistoa (n =2)(hidden replication) jokaiseen soluun. Alla on tulokset näin syntyneen 2 3 saturoidusta mallista. Tulokset vahvistavat edelleen, etteivät myöskään CD ja ACD ole tilastollisesti merkitseviä, joten ne voidaan poistaa myös lopullisesta mallista. Saturoidun mallin variannsitaulu: Source DF Squares Mean Square F Value Pr > F Model <.0001 Error Corrected R-Square Coeff Var Root MSE y Mean Source DF Type III SS Mean Square F Value Pr > F A <.0001 C A*C <.0001 D A*D C*D A*C*D
19 Lopullisen mallin estimaatit: The GLM Procedure Dependent Variable: y Filtration rate (gal/h) Sum of Source DF Squares Mean Square F Value Pr > F Model <.0001 Error Corrected R-Square Coeff Var Root MSE y Mean Source DF Type III SS Mean Square F Value Pr > F A <.0001 C D <.0001 A*C <.0001 A*D <.0001 Standard Parameter Estimate Error t Value Pr > t Intercept <.0001 A <.0001 C D <.0001 A*C <.0001 A*D <.0001 Residuaalien normaalisuuskuvion (Normal probability plot) perusteella ei esiinny merkittäviä poikkeamia, joten malli näiltä osinnäyttäisi olevan riittävä
20 Estimoitu regressiomalli on siis muotoa: ˆy = A C D (2) 9.06 AC AD Havaitaan jälleen, että tuotannon maksimin määrittämisessä yhdysvaikutustekijät ovat avainasemassa. Huom. 6.4: Kun faktorit ovat kvantitatiivisa, voidaan vali [ 1, 1] ajatella ääripäiksi, jossa skaalaamalla uudestaan alaraja ilmaisee %-osuuden faktorin maksimiarvostajayläraja 100%. Jos tarkastellaan vain päävaikutuksia, maksimi saavutettaisiin, kun A = C = D = 1, jolloin läpäisy päävaikutuksilla ennustettuna olisi , (täyden mallin ennuste , eli liki sama, johtuen siitä, että ja 8.32 käytännöllisesti katsoen kumoavat toisensa). Kuitenkin AC:n kerroin on negatiivinen, jolloin valitsemalla A tai C negatiiviseksi, muuttuu vaikutus positiiviseksi. Tässä kannattaavalitac negatiiviseksi. Maksimi löytyy tekijöiden ääriarvoista (±1) valitsemalla A =1,C = 1, D = 1, jolloin ˆy =
21 Esimerkki 6.5: Data transformation in Factorial Design. Tarkastella jälleen 2 4 koetta, jossa on vain yksi toisto. Vastemuuttuja (Response): y: Advance rate of a dill Faktorit: A: Drill load B: Flow rate C: Rotational speed D: Drilling mud used Saturoidun mallin faktoreiden estimaatit: ========================== Parameter Estimate A B A*B C A*C B*C A*B*C D A*D B*D A*B*D C*D A*C*D B*C*D A*B*C*D ========================== 41 42
22 Normaalisuuskuvio: Normal Probability Plot of Effect Coefficients Estimoitaessa vastaava malli, jäännöskuviot ovat seuraavat: 3 2 C B Standard normal deviate BD BC D Kuvioiden perusteella virhtemin varianssi ei näytä ole- -2 van vakio eikä normaalisuus toteudu Estimate Kuvion mukaan merkittäviä tekijöitä ovat B, C, D, BC ja BD. Koska vastemuuttuja on nopeus (rate), log-muunnos y =logy, jossa log on luonnollinen logaritmi, on yleisesti järkevä vaihtoehto
23 Muunnetun mallin kertoimien normaalikuvion perusteella vain B, C ja D päävaikutukset ovat merkityksellisiä. Normal variable value Normal Probability Plot of Factor Effects D C B Estimointitulokset: Dependent Variable: yl log dill rate Sum of Source DF Squares Mean Square F Value Pr > F Model <.0001 Error Corrected R-Square Coeff Var Root MSE yl Mean Source DF Type III SS Mean Square F Value Pr > F B <.0001 C <.0001 D Standard Parameter Estimate Error t Value Pr > t Intercept <.0001 B <.0001 C <.0001 D Factor effect 45 46
24 Jäännöstarkastelut (mallin riittävyys) Keskipistearvon lisääminen 2 k koeasetelmaan 2 k faktorikokeissa implisiittisenä oletuksena on, että faktoreiden vaikutus on lineaarista. Osittain yhdysvaikutustermin kautta voidaan huomioida mahdollista epälineaarisuutta. Kuvioiden perusteella kaikki malli on näiltä osinok. Lopputuloksena on, että vain faktoreiden Flow, Speed ja Mud päävaikutuksilla on merkitystä. Yhdysvaikutuksen puuttuessa, niitä voidaan säädellä toisistaan riippumatta poraustulosta optimoitaessa. Toteuttamalla kokeet myös faktorin 1 ja +1 arvojen lisäksi myös nolla -arvolla saadaan tutkittua mahdollista epälineaarista vaikutusta vastemuuttujaan. Huom. 6.5: Oletuksena tässä lähestymistavassa on, että faktorit ovat kvantitatiivisia. Estimoitava malli ajatellaan olevan muotoa: (3) k y = β 0 + β i x i + k βij x i x j + β jj x 2 j + ε j=1 i<j i=1 Testatttava hypoteesi (4) H 0 : β 11 = = β kk =
25 Teknisesti tämä onnistuu lisäämällä yksi faktoritaso lisää. Keskipistetasolla (kaikki faktorit nolla-tasolla) toistoja tehdään n c kappaletta, jotka satunnaistetaan kokeen suunnitteluvaiheessa tavanomaiseen tapaan. Esimerkki 6.6: Oletetaan, että suodatusesimerkissä (Esim. 6.4) keskipistetasolla (0, 0, 0, 0) on tehty neljä toistoa, joista on saatu arvot 73, 75, 66 ja 69. Määritellään uusi muuttuja cp = 1, kun center point havainto ja cp = 0 muuten. SAS-toteutus on seuraava: proc glm:ssä analyysi totetutetaan regressioestimoinnilla (kvantitatiiviset faktorit)
26 options ls = 80; data filtration; input A B C D cp y; label y = "Filtration rate (gal/h)" A = "Temperature" B = "Pressure" C = "Concentration of formaldehyde" D = "Stirring rate" cp = "Center point"; datalines; ; run; Saturoidun mallin tulokset: The GLM Procedure Dependent Variable: y Filtration rate (gal/h) Sum of Source DF Squares Mean Square F Value Pr > F Model Error Corrected R-Square Coeff Var Root MSE y Mean Source DF Type III SS Mean Square F Value Pr > F A B A*B C A*C B*C A*B*C D A*D B*D A*B*D C*D A*C*D B*C*D A*B*C*D cp Title "Filtration example with center point"; Proc glm data = filtration; model y = A B C D cp /ss3; run; 51 52
27 Center point taso ei ole tilastolliseti merkitsevä (p-arvo 0.78), joten tekijöillä eioleepälineaarisuutta (kvadraattisia tekijöitä), eli nollahypoteesia ei hylätä. H 0 : β 11 = = β 44 =0 Havaitaan jälleen, että vaintekijät A, C, D, AC ja AD ovat tilastolliseti merkitseviä. 53
Lähtökohta: k faktoria, kullakin kaksi tasoa ("high", "low"). tulee katettua (complete replicate). Havaintojen
6. 2 k faktorikokeet Lähtökohta: k faktoria, kullakin kaksi tasoa ("high", "low"). Vähintään 2 k havaintoa, jotta kaikki vaihtoehdot tulee katettua (complete replicate). Havaintojen kokonaismäärä N = 2
Lisätiedot6. 2 k faktorikokeet. Lähtökohta: k faktoria, kullakin kaksi tasoa ("high", "low"). määrä per faktoritasokombinaatio (balansoidussa)kokeessa.
6. 2 k faktorikokeet Lähtökohta: k faktoria, kullakin kaksi tasoa ("high", "low"). Vähintään 2 k havaintoa, jotta kaikki vaihtoehdot tulee katettua (complete replicate). Havaintojen kokonaismäärä N =2
LisätiedotLohkotekijät muodostuvat faktoreista, joiden suhteen ei voida tehdä (täydellistä) satunnaistamista.
7. Lohkominen ja sulautus 2 k kokeissa Lohkominen (Blocking) Lohkotekijät muodostuvat faktoreista, joiden suhteen ei voida tehdä (täydellistä) satunnaistamista. Esimerkiksi faktorikokeessa raaka-aine-erät
Lisätiedot7. Lohkominen ja sulautus 2 k kokeissa. Lohkominen (Blocking)
7. Lohkominen ja sulautus 2 k kokeissa Lohkominen (Blocking) Lohkotekijät muodostuvat faktoreista, joiden suhteen ei voida tehdä (täydellistä) satunnaistamista. Esimerkiksi faktorikokeessa raaka-aine-erät
Lisätiedot7. Lohkominen ja sulautus 2 k kokeissa. Lohkominen (Blocking)
7. Lohkominen ja sulautus 2 k kokeissa Lohkominen (Blocking) Lohkotekijät muodostuvat faktoreista, joiden suhteen ei voida tehdä (täydellistä) satunnaistamista. Esimerkiksi faktorikokeessa raaka-aine-erät
Lisätiedotproc glm data = ex61; Title2 "Aliasing Structure of the 2_IV^(5-1) design"; model y = A B C D E /Aliasing; run; quit;
Title "Exercises 6"; Data ex61; input A B C D E y @@; Label A = "Furnance Temperature" B = "Heating Time" C = "Transfer Time" D = "Hold Down Time" E = "Quench of Oil Temperature" y = "Free Height of Leaf
LisätiedotFaktorikokeilla tarkoitetaan koesuunnitelmaa, jossa koe toistetaan kaikilla faktoreiden tasojen kombninaatioilla.
5. Johdatus faktorikokeisiin 5.1 Taustaa Faktorikokeilla tarkoitetaan koesuunnitelmaa, jossa koe toistetaan kaikilla faktoreiden tasojen kombninaatioilla. Täten, jos faktorilla A on a tasoa ja faktorilla
Lisätiedot5. Johdatus faktorikokeisiin. Tekijän omaa vaikutusta vastemuuttujaan sanotaan. 5.1 Taustaa
5. Johdatus faktorikokeisiin 5.1 Taustaa Faktorikokeilla tarkoitetaan koesuunnitelmaa, jossa koe toistetaan kaikilla faktoreiden tasojen kombninaatioilla. Täten, jos faktorilla A on a tasoa ja faktorilla
Lisätiedot2 k -faktorikokeet. Vilkkumaa / Kuusinen 1
2 k -faktorikokeet Vilkkumaa / Kuusinen 1 Motivointi 2 k -faktorikoe on k-suuntaisen varianssianalyysin erikoistapaus, jossa kaikilla tekijöillä on vain kaksi tasoa, matala (-) ja korkea (+). 2 k -faktorikoetta
Lisätiedot5. Johdatus faktorikokeisiin. Tekijän omaa vaikutusta vastemuuttujaan sanotaan. 5.1 Taustaa
5. Johdatus faktorikokeisiin 5.1 Taustaa Faktorikokeilla tarkoitetaan koesuunnitelmaa, jossa koe toistetaan kaikilla faktoreiden tasojen kombninaatioilla. Täten, jos faktorilla A on a tasoa ja faktorilla
LisätiedotKeskipisteen lisääminen 2 k -faktorikokeeseen (ks. Montgomery 9-6)
Mat-.3 Koesuunnittelu ja tilastolliset mallit kevät Keskipisteen lisääminen k -faktorikokeeseen (ks. Montgomery 9-6) Esim (Montg. ex. 9-, 6-): Tutkitaan kemiallisen prosessin saannon Y riippuvuutta faktoreista
LisätiedotKaksitasoiset hierarkiset asetelmat (Two-Stage Nested Designs) 9. Muita koeasetelmia. 9.1 Hierarkiset asetelmat (Nested Designs)
9. Muita koeasetelmia 9.1 Hierarkiset asetelmat (Nested Designs) Tietyissä koetilanteissa yhden faktorin tasot ovat samanlaisia joskaan ei täysin identtisiä toisen faktorin eri tasoilla. Tällaista asetelmaa
Lisätiedotnopeasti täydessä toteutuksessa (complete replicate).
8. Osittaiset 2 k faktorikokeet Faktoreiden lukumäärän k kasvaessa 2 k koeasetelmassa kasvaa koetoistojen (runs) määrää nopeasti täydessä toteutuksessa (complete replicate). Esimerkiksi 2 6 asetelman täysi
Lisätiedot8. Osittaiset 2 k faktorikokeet. Niinpä, jos voidaan olettaa, että korekeamman
8. Osittaiset 2 k faktorikokeet Faktoreiden lukumäärän k kasvaessa 2 k koeasetelmassa kasvaa koetoistojen (runs) määrää nopeasti täydessä toteutuksessa (complete replicate). Esimerkiksi 2 6 asetelman täysi
Lisätiedot9.1 Hierarkiset asetelmat (Nested Designs)
9. Muita koeasetelmia 9.1 Hierarkiset asetelmat (Nested Designs) Tietyissä koetilanteissa yhden faktorin tasot ovat samanlaisia joskaan ei täysin identtisiä toisen faktorin eri tasoilla. Tällaista asetelmaa
LisätiedotTavoite on eliminoida sen vaikutus koetuloksista. 4. Satunnaistetut lohkokokeet, latinalaiset neliöt ja vastaavat asetelmat. Eliminointimenetelmiä:
4. Satunnaistetut lohkokokeet, latinalaiset neliöt ja vastaavat asetelmat 4.1 Satunnaistettu lohkokoe (Randomized Block Design) Kiusatekijä (nuisance factor): Kiusatekijä on taustatekijä, joka voi vaikuttaa
LisätiedotOsafaktorikokeet. Heliövaara 1
Osafaktorikokeet Heliövaara 1 Osafaktorikokeet Kun faktorien määrä 2 k -faktorikokeessa kasvaa, tarvittavien havaintojen määrä voi ylittää kokeentekijän resurssit. Myös estimoitavien korkean asteen yhdysvaikutustermien
LisätiedotA250A0050 Ekonometrian perusteet Tentti
A250A0050 Ekonometrian perusteet Tentti 28.9.2016 Tentissä ei saa käyttää laskinta. Tentistä saa max 80 pistettä. Hyväksytysti suoritetusta harjoitustyöstä saa max 20 pistettä. Huom. Merkitse vastauspaperin
Lisätiedot9. Muita koeasetelmia. Kaksitasoiset hierarkiset asetelmat (Two-Stage Nested Designs) 9.1 Hierarkiset asetelmat (Nested Designs)
9. Muita koeasetelmia 9.1 Hierarkiset asetelmat (Nested Designs) Tietyissä koetilanteissa yhden faktorin tasot ovat samanlaisia joskaan ei täysin identtisiä toisen faktorin eri tasoilla. Tällaista asetelmaa
LisätiedotKoesuunnittelu 2 k -faktorikokeet. TKK (c) Ilkka Mellin (2005) 1
Koesuunnittelu 2 k -faktorikokeet TKK (c) Ilkka Mellin (2005) 2 k -faktorikokeet 2 2 -faktorikokeet 2 3 -faktorikokeet 2 k -faktorikokeet TKK (c) Ilkka Mellin (2005) 2 2 k -faktorikokeet: Mitä opimme?
LisätiedotOsafaktorikokeet. Kurssipalautetta voi antaa Oodissa Kuusinen/Heliövaara 1
Osafaktorikokeet Kurssipalautetta voi antaa Oodissa 27.4.-25.5. Kuusinen/Heliövaara 1 Osafaktorikokeet Kun faktorien määrä 2 k -faktorikokeessa kasvaa, tarvittavien havaintojen määrä voi ylittää kokeen
LisätiedotTässä harjoituksessa käydään läpi R-ohjelman käyttöä esimerkkidatan avulla. eli matriisissa on 200 riviä (havainnot) ja 7 saraketta (mittaus-arvot)
R-ohjelman käyttö data-analyysissä Panu Somervuo 2014 Tässä harjoituksessa käydään läpi R-ohjelman käyttöä esimerkkidatan avulla. 0) käynnistetään R-ohjelma Huom.1 allaolevissa ohjeissa '>' merkki on R:n
LisätiedotVARIANSSIANALYYSI ANALYSIS OF VARIANCE
VARIANSSIANALYYSI ANALYSIS OF VARIANCE 1 Suomalaisten aikuisten pituusjakauma:.8.7.6.5.4.3.2.1 14 15 16 17 18 19 2 21 Jakauma ei ole normaali, sen olettaminen sellaiseksi johtaa virheellisiin päätelmiin.
Lisätiedot[MTTTA] TILASTOMENETELMIEN PERUSTEET, KEVÄT 209 https://coursepages.uta.fi/mttta/kevat-209/ HARJOITUS 5 viikko 8 RYHMÄT: ke 2.5 3.45 ls. C6 Leppälä to 08.30 0.00 ls. C6 Korhonen to 2.5 3.45 ls. C6 Korhonen
LisätiedotVastepintamenetelmä. Kuusinen/Heliövaara 1
Vastepintamenetelmä Kuusinen/Heliövaara 1 Vastepintamenetelmä Vastepintamenetelmässä pyritään vasteen riippuvuutta siihen vaikuttavista tekijöistä approksimoimaan tekijöiden polynomimuotoisella funktiolla,
Lisätiedot4. Satunnaistetut lohkokokeet, latinalaiset neliöt ja vastaavat asetelmat. Kiusatekijä on taustatekijä, joka voi vaikuttaa
4. Satunnaistetut lohkokokeet, latinalaiset neliöt ja vastaavat asetelmat 4.1 Satunnaistettu lohkokoe (Randomized Block Design) Kiusatekijä (nuisance factor): Kiusatekijä on taustatekijä, joka voi vaikuttaa
Lisätiedot3. Yhden faktorin kokeet. 3.1 Varianssianalyysi. Yhden faktorin koeasetelma, jossa faktorilla on a tasoa (kokeessa on a käsittelyä).
3. Yhden faktorin kokeet 3.1 Varianssianalyysi Yhden faktorin koeasetelma, jossa faktorilla on a tasoa (kokeessa on a käsittelyä). Esimerkki 3.1: Tutkitaan kankaassa käytettävän synteettisen kuidun vetolujuutta,
Lisätiedot3. Yhden faktorin kokeet. 3.1 Varianssianalyysi. Yhden faktorin koeasetelma, jossa faktorilla on a tasoa (kokeessa on a käsittelyä).
3. Yhden faktorin kokeet 3.1 Varianssianalyysi Yhden faktorin koeasetelma, jossa faktorilla on a tasoa (kokeessa on a käsittelyä). Esimerkki 3.1: Tutkitaan kankaassa käytettävän synteettisen kuidun vetolujuutta,
LisätiedotKaksisuuntaisen varianssianalyysin tilastollisessa malli voidaan esittää seuraavassa muodossa:
Mat-.03 Koesuunnittelu ja tilastolliset mallit Mat-.03 Koesuunnittelu ja tilastolliset mallit / Ratkaisut Aiheet: Avainsanat: Kaksisuuntainen varianssianalsi Aritmeettinen keskiarvo, Estimointi, F-testi,
LisätiedotTilastollinen vastepintamallinnus: kokeiden suunnittelu, regressiomallin analyysi, ja vasteen optimointi. Esimerkit laskettu JMP:llä
Tilastollinen vastepintamallinnus: kokeiden suunnittelu, regressiomallin analyysi, ja vasteen optimointi Esimerkit laskettu JMP:llä Antti Hyttinen Tampereen teknillinen yliopisto 29.12.2003 ii Ohjelmien
LisätiedotVastepintamenetelmä. Vilkkumaa / Kuusinen 1
Vastepintamenetelmä Vilkkumaa / Kuusinen 1 Motivointi Varianssianalyysissa tutkitaan tekijöiden vaikutusta vasteeseen siten, että tekijöiden tasot on ennalta valittu. - Esim. tutkitaan kemiallisen prosessin
LisätiedotYhden faktorin koeasetelma, jossa faktorilla on a tasoa (kokeessa on a käsittelyä).
3. Yhden faktorin kokeet 3.1 Varianssianalyysi Yhden faktorin koeasetelma, jossa faktorilla on a tasoa (kokeessa on a käsittelyä). Esimerkki 3.1: Tutkitaan kankaassa käytettävän synteettisen kuidun vetolujuutta,
LisätiedotToimittaja 1 2 3 Erä 1 2 3 4 1 2 3 4 1 2 3 4 1 2 2 1 1 0 1 0 2 2 1 3 1 3 0 4 2 4 0 3 4 0 1 2 0 4 1 0 3 2 2 2 0 2 2 1
Mat-.03 Koesuunnittelu ja tilastolliset mallit / Ratkaisut Aiheet: Avainsanat: Hierarkkiset koeasetelmat -faktorikokeet Vastepintamenetelmä Aritmeettinen keskiarvo, Estimaatti, Estimaattori, -testi, aktorikokeet,
LisätiedotLohkoasetelmat. Vilkkumaa / Kuusinen 1
Lohkoasetelmat Vilkkumaa / Kuusinen 1 Motivointi 1/3 Kaksisuuntaisella varianssianalyysilla voidaan tutkia kahden tekijän A ja B vaikutusta sekä niiden yhdysvaikutusta tutkimuksen kohteeseen Kaksisuuntaisessa
LisätiedotKertausluento. Vilkkumaa / Kuusinen 1
Kertausluento Vilkkumaa / Kuusinen 1 Kokeellinen tutkimus Kokeellisessa tutkimuksessa on tavoitteena selvittää, miten erilaiset käsittelyt vaikuttavat tutkimuksen kohteisiin - Esim. miten lämpötila ja
LisätiedotKoesuunnittelu Vastepintamenetelmä. TKK (c) Ilkka Mellin (2005) 1
Koesuunnittelu Vastepintamenetelmä TKK (c) Ilkka Mellin (2005) 1 Vastepintamenetelmä Vastepintamenetelmä: Johdanto 2 k -faktorikokeet Vastefunktion kaarevuuden testaaminen 1. asteen vastepintamallin varianssianalyysihajotelma
LisätiedotLatinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt: Mitä opimme? Latinalaiset neliöt
TKK (c) Ilkka Mellin (005) Koesuunnittelu TKK (c) Ilkka Mellin (005) : Mitä opimme? Tarkastelemme tässä luvussa seuraavaa kysymystä: Miten varianssianalyysissa tutkitaan yhden tekijän vaikutusta vastemuuttujaan,
LisätiedotRegressioanalyysi. Vilkkumaa / Kuusinen 1
Regressioanalyysi Vilkkumaa / Kuusinen 1 Regressioanalyysin idea ja tavoitteet Regressioanalyysin idea: Halutaan selittää selitettävän muuttujan havaittujen arvojen vaihtelua selittävien muuttujien havaittujen
Lisätiedot1. PÄÄTTELY YHDEN SELITTÄJÄN LINEAARISESTA REGRESSIOMALLISTA
Mat-2.104 Tilastollisen analyysin perusteet / Ratkaisut Aiheet: Avainsanat Päättely yhden selittäjän lineaarisesta regressiomallista Ennustaminen, Ennuste, Ennusteen luottamusväli, Estimaatti, Estimaattori,
LisätiedotEsim Brand lkm keskiarvo keskihajonta A ,28 5,977 B ,06 3,866 C ,95 4,501
Esim. 2.1.1. Brand lkm keskiarvo keskihajonta A 10 251,28 5,977 B 10 261,06 3,866 C 10 269,95 4,501 y = 260, 76, n = 30 SS 1 = (n 1 1)s 2 1 = (10 1)5, 977 2 321, 52 SS 2 = (n 2 1)s 2 2 = (10 1)3, 8662
LisätiedotResiduaalit. Residuaalit. UK Ger Fra US Austria. Maat
TAMPEREEN YLIOPISTO Tilastollisen mallintamisen harjoitustyö Teemu Kivioja ja Mika Helminen Epätasapainoisen koeasetelman analyysi Worksheet 5 Matematiikan, tilastotieteen ja filosofian laitos Tilastotiede
Lisätiedot2. Keskiarvojen vartailua
2. Keskiarvojen vartailua Esimerkki 2.1: Oheiset mittaukset liittyvät Portland Sementin sidoslujuuteen (kgf/cm 2 ). Mittaukset y 1 ovat nykyisestä seoksesta ja mittaukset y 2 uudesta seoksesta, jossa lisäaineena
Lisätiedot4. Satunnaistetut lohkokokeet, latinalaiset neliöt ja vastaavat asetelmat. Tavoite on eliminoida sen vaikutus koetuloksista. Eliminointimenetelmiä:
4. Satunnaistetut lohkokokeet, latinalaiset neliöt ja vastaavat asetelmat Tavoite on eliminoida sen vaikutus koetuloksista. 4.1 Satunnaistettu lohkokoe (Randomized Block Design) Kiusatekijä (nuisance factor):
LisätiedotJakaumien merkitys biologisissa havaintoaineistoissa: Löytyykö ratkaisu Yleistetyistä Lineaarisista (Seka)Malleista?
1 Hydrobiologian tutkijaseminaari 20.3.2000 Jakaumien merkitys biologisissa havaintoaineistoissa: Löytyykö ratkaisu Yleistetyistä Lineaarisista (Seka)Malleista? Jari Hänninen Turun yliopisto Saaristomeren
Lisätiedot1. Tutkitaan tavallista kahden selittäjän regressiomallia
TA7, Ekonometrian johdantokurssi HARJOITUS 5 RATKAISUEHDOTUKSET 232215 1 Tutkitaan tavallista kahden selittäjän regressiomallia Y i = β + β 1 X 1,i + β 2 X 2,i + u i (a) Kirjoita regressiomalli muodossa
LisätiedotRegressioanalyysi. Kuusinen/Heliövaara 1
Regressioanalyysi Kuusinen/Heliövaara 1 Regressioanalyysin idea ja tavoitteet Regressioanalyysin idea: Oletetaan, että haluamme selittää jonkin selitettävän muuttujan havaittujen arvojen vaihtelun joidenkin
LisätiedotKaksisuuntainen varianssianalyysi. Heliövaara 1
Kaksisuuntainen varianssianalyysi Heliövaara 1 Kaksi- tai useampisuuntainen varianssianalyysi Kaksi- tai useampisuuntaisessa varianssianalyysissa perusjoukko on jaettu ryhmiin kahden tai useamman tekijän
LisätiedotLohkoasetelmat. Heliövaara 1
Lohkoasetelmat Heliövaara 1 Kiusatekijä Kaikissa kokeissa, kokeen tuloksiin voi vaikuttaa vaihtelu joka johtuu kiusatekijästä. Kiusatekijä on tekijä, jolla mahdollisesti on vaikutusta vastemuuttujan arvoon,
LisätiedotPerusnäkymä yksisuuntaiseen ANOVAaan
Metsämuuronen 2006. TTP Tutkimuksen tekemisen perusteet ihmistieteissä Taulukko.51.1 Analyysiin mukaan tulevat muuttujat Mja selite Merkitys mallissa F1 Ensimmäinen faktoripistemuuttuja Selitettävä muuttuja
LisätiedotOHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi. Luento 3
OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi Luento 3 Tutkimussuunnitelman rakenne-ehdotus Otsikko 1. Motivaatio/tausta 2. Tutkimusaihe/ -tavoitteet ja kysymykset
Lisätiedot(d) Laske selittäjään paino liittyvälle regressiokertoimelle 95 %:n luottamusväli ja tulkitse tulos lyhyesti.
2. VÄLIKOE vuodelta -14 1. Liitteessä 1 on esitetty R-ohjelmalla saatuja tuloksia aineistosta, johon on talletettu kahdenkymmenen satunnaisesti valitun miehen paino (kg), vyötärön ympärysmitta (cm) ja
LisätiedotVastepintamenetelmä. Heliövaara 1
Vastepintamenetelmä Kurssipalautteen antamisesta saa hyvityksenä yhden tenttipisteen. Palautelomakkeeseen tulee lähiaikoina linkki kurssin kotisivuille. Heliövaara 1 Vastepintamenetelmä Vastepintamenetelmässä
LisätiedotTilastollisen analyysin perusteet Luento 9: Moniulotteinen lineaarinen. regressio
Tilastollisen analyysin perusteet Luento 9: lineaarinen lineaarinen Sisältö lineaarinen lineaarinen lineaarinen Lineaarinen Oletetaan, että meillä on n kappaletta (x 1, y 1 ), (x 2, y 2 )..., (x n, y n
LisätiedotUSEAN MUUTTUJAN REGRESSIOMALLIT JA NIIDEN ANA- LYYSI
TEORIA USEAN MUUTTUJAN REGRESSIOMALLIT JA NIIDEN ANA- LYYSI Regressiomalleilla kuvataan tilanteita, jossa suureen y arvot riippuvat joukosta ns selittäviä muuttujia x 1, x 2,..., x p oletetun funktiomuotoisen
LisätiedotYleistetyistä lineaarisista malleista
Yleistetyistä lineaarisista malleista Tilastotiede käytännön tutkimuksessa -kurssi, kesä 2001 Reijo Sund Klassinen lineaarinen malli y = Xb + e eli E(Y) = m, jossa m = Xb Satunnaiskomponentti: Y:n komponentit
Lisätiedotxi = yi = 586 Korrelaatiokerroin r: SS xy = x i y i ( x i ) ( y i )/n = SS xx = x 2 i ( x i ) 2 /n =
1. Tutkitaan paperin ominaispainon X(kg/dm 3 ) ja puhkaisulujuuden Y (m 2 ) välistä korrelaatiota. Tiettyä laatua olevasta paperierästä on otettu satunnaisesti 10 arkkia ja määritetty jokaisesta arkista
LisätiedotSisällysluettelo 6 REGRESSIOANALYYSI. Metsämuuronen: Monimuuttujamenetelmien perusteet SPSS-ympäristössä ALKUSANAT... 4 ALKUSANAT E-KIRJA VERSIOON...
Sisällysluettelo ALKUSANAT... 4 ALKUSANAT E-KIRJA VERSIOON...5 SISÄLLYSLUETTELO... 6 LYHYT SANASTO VASTA-ALKAJILLE... 7 1. MONIMUUTTUJAMENETELMÄT IHMISTIETEISSÄ... 9 1.1 MONIMUUTTUJA-AINEISTON ERITYISPIIRTEITÄ...
LisätiedotSAS/IML käyttö ekonometristen mallien tilastollisessa päättelyssä. Antti Suoperä 16.11.2009
SAS/IML käyttö ekonometristen mallien tilastollisessa päättelyssä Antti Suoperä 16.11.2009 SAS/IML käyttö ekonometristen mallien tilastollisessa päättelyssä: Matriisi ja vektori laskennan ohjelmisto edellyttää
LisätiedotSovellettu todennäköisyyslaskenta B
Sovellettu todennäköisyyslaskenta B Antti Rasila 22. marraskuuta 2007 Antti Rasila () TodB 22. marraskuuta 2007 1 / 17 1 Epäparametrisia testejä (jatkoa) χ 2 -riippumattomuustesti 2 Johdatus regressioanalyysiin
LisätiedotData-analyysi II. Sisällysluettelo. Simo Kolppo [Type the document subtitle]
Data-analyysi II [Type the document subtitle] Simo Kolppo 26.3.2014 Sisällysluettelo Johdanto... 1 Tutkimuskysymykset... 1 Aineistojen esikäsittely... 1 Economic Freedom... 1 Nuorisobarometri... 2 Aineistojen
LisätiedotHierarkkiset koeasetelmat. Heliövaara 1
Hierarkkiset koeasetelmat Heliövaara 1 Hierarkkiset koeasetelmat Kaksiasteista hierarkkista koeasetelmaa käytetään tarkasteltaessa seuraavaa kysymystä: Miten varianssianalyysissa tutkitaan kahden tekijän
Lisätiedot1. YKSISUUNTAINEN VARIANSSIANALYYSI: AINEISTON ESITYSMUODOT
Mat-2.104 Tilastollisen analyysin perusteet / Ratkaisut Aiheet: Avainsanat: Yksisuuntainen varianssianalyysi Bartlettin testi, Bonferronin menetelmä, F-testi, Jäännösneliösumma, χ 2 -testi, Kokonaiskeskiarvo,
Lisätiedot1. REGRESSIOMALLIN SYSTEMAATTISEN OSAN MUOTO
Mat-2.104 Tilastollisen analyysin perusteet / Ratkaisut Aiheet: Avainsanat: Regressiodiagnostiikka Cooken etäisyys, Funktionaalinen muoto, Diagnostinen grafiikka, Diagnostiset testit, Heteroskedastisuus,
LisätiedotTilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä
Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä arvon Sisältö arvon Bootstrap-luottamusvälit arvon arvon Oletetaan, että meillä on n kappaletta (x 1, y 1 ),
LisätiedotAltistusaika 1 kk 2 kk 3 kk 1.35 1.53 1.38 1.35 1.63 1.51 1.60 1.40 2.18 1.77 1.66 1.98 1.73 1.76 1.60 1.72
Mat-.03 Koesuunnittelu ja tilastolliset mallit Mat-.03 Koesuunnittelu ja tilastolliset mallit / Ratkaisut iheet: vainsanat: Kaksisuuntainen varianssianalsi Lohkoasetelmat Latinalaiset neliöt ritmeettinen
Lisätiedot54. Tehdään yhden selittäjän lineaarinen regressioanalyysi, kun selittäjänä on määrällinen muuttuja (ja selitettävä myös):
Tilastollinen tietojenkäsittely / SPSS Harjoitus 5 Tarkastellaan ensin aineistoa KUNNAT. Kyseessähän on siis kokonaistutkimusaineisto, joten tilastollisia testejä ja niiden merkitsevyystarkasteluja ei
LisätiedotKemometriasta. Matti Hotokka Fysikaalisen kemian laitos Åbo Akademi Http://www.abo.fi/~mhotokka
Kemometriasta Matti Hotokka Fysikaalisen kemian laitos Åbo Akademi Http://www.abo.fi/~mhotokka Mistä puhutaan? Määritelmiä Määritys, rinnakkaismääritys Mittaustuloksen luotettavuus Kalibrointi Mittausten
LisätiedotLohkoasetelmat. Kuusinen/Heliövaara 1
Lohkoasetelmat Kuusinen/Heliövaara 1 Kiusatekijä Kaikissa kokeissa kokeen tuloksiin voi vaikuttaa vaihtelu, joka johtuu kiusatekijästä. Kiusatekijä on tekijä, jolla on mahdollisesti vaikutusta vastemuuttujan
LisätiedotHarjoitus 9: Excel - Tilastollinen analyysi
Harjoitus 9: Excel - Tilastollinen analyysi Mat-2.2107 Sovelletun matematiikan tietokonetyöt Syksy 2006 Mat-2.2107 Sovelletun matematiikan tietokonetyöt 1 Harjoituksen aiheita Tutustuminen regressioanalyysiin
LisätiedotMat Tilastollisen analyysin perusteet. Painotettu PNS-menetelmä. Avainsanat:
Mat-2.104 Tilastollisen analyysin perusteet / Ratkaisut Aiheet: Avainsanat: Mallin valinta Painotettu PNS-menetelmä Alaspäin askellus, Askellus, Askeltava valikointi, Diagnostinen grafiikka, Diagnostiset
LisätiedotYhden selittäjän lineaarinen regressiomalli (jatkoa) Ensi viikolla ei pidetä luentoa eikä harjoituksia. Heliövaara 1
Yhden selittäjän lineaarinen regressiomalli (jatkoa) Ensi viikolla ei pidetä luentoa eikä harjoituksia Heliövaara 1 Regressiokertoimien PNS-estimaattorit Määritellään havaintojen x j ja y j, j = 1, 2,...,n
LisätiedotMS-A0204 Differentiaali- ja integraalilaskenta 2 (ELEC2) Luento 7: Pienimmän neliösumman menetelmä ja Newtonin menetelmä.
MS-A0204 Differentiaali- ja integraalilaskenta 2 (ELEC2) Luento 7: Pienimmän neliösumman menetelmä ja Newtonin menetelmä. Antti Rasila Matematiikan ja systeemianalyysin laitos Aalto-yliopisto Kevät 2016
LisätiedotOpiskelija viipymisaika pistemäärä
806109 TILASTOTIETEEN PERUSMENETELMÄT I Harjoitus 7, viikko 9, kevät 2012 (Muut kuin taloustieteiden tiedekunnan opiskelijat) MUISTA MIKROLUOKKAHARJOITUKSET VIIKOILLA 8 JA 9! 1. Jatkoa harjoituksen 5 tehtävään
LisätiedotKaksisuuntainen varianssianalyysi. Vilkkumaa / Kuusinen 1
Kaksisuuntainen varianssianalyysi Vilkkumaa / Kuusinen 1 Motivointi Luennot 6 ja 7: yksisuuntaisella varianssianalyysilla testataan ryhmäkohtaisten odotusarvojen yhtäsuuruutta, kun perusjoukko on jaettu
Lisätiedot1. USEAN SELITTÄJÄN LINEAARINEN REGRESSIOMALLI JA OSITTAISKORRELAATIO
Mat-2.104 Tilastollisen analyysin perusteet / Ratkaisut Aiheet: Avainsanat Usean selittäjän lineaarinen regressiomalli Estimaatti, Estimaattori, Estimointi, Jäännösneliösumma, Jäännöstermi, Jäännösvarianssi,
LisätiedotABHELSINKI UNIVERSITY OF TECHNOLOGY
Johdatus regressioanalyysiin Regressioanalyysin idea Oletetaan, että haluamme selittää jonkin selitettävän muuttujan havaittujen arvojen vaihtelun selittävien muuttujien havaittujen arvojen vaihtelun avulla.
LisätiedotViherseinien efekti Tilastoanalyysi
Viherseinien efekti Tilastoanalyysi Risto Heikkinen Tutkimuskysymykset Seinän vaikutus koettuun haittoihin työympäristössä? Seinän vaikutus oireiden määrään? Mitkä tekijät selittävät viherseinän jatkokäytön
Lisätiedot1. KAKSISUUNTAINEN VARIANSSIANALYYSI: TULOSTEN TULKINTA
Mat-2.104 Tilastollisen analyysin perusteet / Ratkaisut Aiheet: Avainsanat: Kaksisuuntainen varianssianalyysi Bonferronin menetelmä, F-testi, Jäännösneliösumma, Kaksisuuntainen varianssianalyysi Kokonaiskeskiarvo,
LisätiedotJohdatus regressioanalyysiin. Heliövaara 1
Johdatus regressioanalyysiin Heliövaara 1 Regressioanalyysin idea Oletetaan, että haluamme selittää jonkin selitettävän muuttujan havaittujen arvojen vaihtelun selittävien muuttujien havaittujen arvojen
LisätiedotKvantitatiiviset menetelmät
Kvantitatiiviset menetelmät HUOM! Tentti pidetään tiistaina.. klo 6-8 V ls. Uusintamahdollisuus on rästitentissä.. ke 6 PR sali. Siihen tulee ilmoittautua WebOodissa 9. 8.. välisenä aikana. Soveltuvan
LisätiedotATH-koulutus: R ja survey-kirjasto THL 16.2.2011. 16. 2. 2011 ATH-koulutus / Tommi Härkänen 1
ATH-koulutus: R ja survey-kirjasto THL 16.2.2011 16. 2. 2011 ATH-koulutus / Tommi Härkänen 1 Sisältö Otanta-asetelman kuvaaminen R:llä ja survey-kirjastolla Perustunnusluvut Regressioanalyysit 16. 2. 2011
LisätiedotHarjoitukset 4 : Paneelidata (Palautus )
31C99904, Capstone: Ekonometria ja data-analyysi TA : markku.siikanen(a)aalto.fi & tuuli.vanhapelto(a)aalto.fi Harjoitukset 4 : Paneelidata (Palautus 7.3.2017) Tämän harjoituskerran tarkoitus on perehtyä
LisätiedotSimuloinnin strategisia kysymyksiä
Simuloinnin strategisia kysymyksiä Timo Tiihonen Tietotekniikan laitos 2010 Simuloinnin strategisia kysymyksiä Miten toimitaan, kun halutaan tietää enemmän kuin yhden simulointimallin tulos. Miten tulos
LisätiedotHarjoitukset 3 : Monimuuttujaregressio 2 (Palautus )
31C99904, Capstone: Ekonometria ja data-analyysi TA : markku.siikanen(a)aalto.fi & tuuli.vanhapelto(a)aalto.fi Harjoitukset 3 : Monimuuttujaregressio 2 (Palautus 7.2.2017) Tämän harjoituskerran tehtävät
LisätiedotTilastollisten menetelmien käyttö Kelan tutkimustoiminnassa
Tilastollisten menetelmien käyttö Kelan tutkimustoiminnassa Risto Lehtonen Helsingin yliopisto Kela 1 Tilastokeskuksen SAS-seminaari 16.11.2009 Aiheita Kelan tutkimustoiminta SAS-sovellukset vaativien
Lisätiedot, Määrälliset tutkimusmenetelmät 2 4 op
6206209, Määrälliset tutkimusmenetelmät 2 4 op Jyrki Reunamo, Helsingin yliopisto, Opettajankoulutuslaitos 19.2.2015 1 Varianssianalyysi (Pallant 2007, Tähtinen & Isoaho 2001) Verrataan ryhmien keskiarvoja.
LisätiedotDynaamiset regressiomallit
MS-C2128 Ennustaminen ja Aikasarja-analyysi, Lauri Viitasaari Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2016 Tilastolliset aikasarjat voidaan jakaa kahteen
LisätiedotTeema 10: Regressio- ja varianssianalyysi
Teema 1: Regressio- ja varianssianalyysi Regressioanalyysi lienee t-testin ohella maailman eniten käytetty tilastollinen menetelmä. Sitä sivuttiin jo alustavasti Teemassa 4. Varianssianalyysi liittyy useallakin
LisätiedotLumipallo regressioanalyysista. Logistinen regressioanalyysi. Soveltuvan menetelmän valinta. Regressioanalyysi. Logistinen regressioanalyysi I
Lumipallo regressioanalyysista jokainen kirjoittaa lapulle yhden lauseen regressioanalyysista ja antaa sen seuraavalle Logistinen regressioanalyysi Y250. Kvantitatiiviset menetelmät (6 op) Hanna Wass tutkijatohtori
LisätiedotMonitasomallit koulututkimuksessa
Metodifestivaali 9.5.009 Monitasomallit koulututkimuksessa Mitä ihmettä? Antero Malin Koulutuksen tutkimuslaitos Jyväskylän yliopisto 009 1 Tilastollisten analyysien lähtökohta: Perusjoukolla on luonnollinen
Lisätiedot2 2 -faktorikokeen määritelmä
TKK (c) Ilkka Mellin (005) Koesuunnittelu TKK (c) Ilkka Mellin (005) : Mitä opimme? Tarkastelemme tässä luvussa seuraavaa kysymystä: Miten varianssianalyysissa tutkitaan kahden tai useamman tekijän vaikutusta
Lisätiedot1. Normaalisuuden tutkiminen, Bowmanin ja Shentonin testi, Rankit Plot, Wilkin ja Shapiron testi
Mat-2.2104 Tilastollisen analyysin perusteet / Ratkaisut Aiheet: Avainsanat: Yhteensopivuuden ja homogeenisuden testaaminen Bowmanin ja Shentonin testi, Hypoteesi, 2 -homogeenisuustesti, 2 -yhteensopivuustesti,
LisätiedotSEM1, työpaja 2 (12.10.2011)
SEM1, työpaja 2 (12.10.2011) Rakenneyhtälömallitus Mplus-ohjelmalla POLKUMALLIT Tarvittavat tiedostot voit ladata osoitteesta: http://users.utu.fi/eerlaa/mplus Esimerkki: Planned behavior Ajzen, I. (1985):
LisätiedotTilastollisen analyysin perusteet Luento 7: Lineaarinen regressio
Tilastollisen analyysin perusteet Luento 7: Lineaarinen regressio Sisältö Regressioanalyysissä tavoitteena on tutkia yhden tai useamman selittävän muuttujan vaikutusta selitettävään muuttujaan. Sen avulla
LisätiedotMat Tilastollisen analyysin perusteet, kevät 2007
Mat-.104 Tilastollisen analyysin perusteet, kevät 007 8. luento: Usean selittäjän lineaarinen regressiomalli Kai Virtanen 1 Usean selittäjän lineaarinen regressiomalli Selitettävän muuttujan havaittujen
LisätiedotAki Taanila VARIANSSIANALYYSI
Aki Taanila VARIANSSIANALYYSI 18.5.2007 VARIANSSIANALYYSI 1 JOHDANTO...2 VARIANSSIANALYYSI...3 Yksisuuntainen varianssianalyysi...3 Kaksisuuntainen varianssianalyysi ilman toistoja...6 Kaksisuuntainen
LisätiedotHarha mallin arvioinnissa
Esitelmä 12 Antti Toppila sivu 1/18 Optimointiopin seminaari Syksy 2010 Harha mallin arvioinnissa Antti Toppila 13.10.2010 Esitelmä 12 Antti Toppila sivu 2/18 Optimointiopin seminaari Syksy 2010 Sisältö
LisätiedotLoad
Tampereen yliopisto Tilastollinen mallintaminen Mikko Alivuotila ja Anne Puustelli Lentokoneiden rakennuksessa käytettävien metallinkiinnittimien puristuskestävyys Matematiikan, tilastotieteen ja filosofian
LisätiedotSisällysluettelo 6 VARIANSSIANALYYSI. Metsämuuronen: Monimuuttujamenetelmien perusteet SPSS-ympäristössä ALKUSANAT... 4 ALKUSANAT E-KIRJA VERSIOON...
Sisällysluettelo ALKUSANAT... 4 ALKUSANAT E-KIRJA VERSIOON...5 SISÄLLYSLUETTELO... 6 LYHYT SANASTO VASTA-ALKAJILLE... 7 1. MONIMUUTTUJAMENETELMÄT IHMISTIETEISSÄ... 9 1.1 MONIMUUTTUJA-AINEISTON ERITYISPIIRTEITÄ...
Lisätiedot