Lähtökohta: k faktoria, kullakin kaksi tasoa ("high", "low"). tulee katettua (complete replicate). Havaintojen
|
|
- Elli Alanen
- 7 vuotta sitten
- Katselukertoja:
Transkriptio
1 6. 2 k faktorikokeet Lähtökohta: k faktoria, kullakin kaksi tasoa ("high", "low"). Vähintään 2 k havaintoa, jotta kaikki vaihtoehdot tulee katettua (complete replicate). Havaintojen kokonaismäärä N = 2 k n, jossa n toistojen määrä per faktoritasokombinaatio (balansoidussa)kokeessa. Oletukset: (1) faktorit kiinteitä (fixed factors), (2) asetelma on täysin satunnaistettu (completely randomized design) (3) virhetermi N(0, σ 2 )-jakautunut. Yleisessä tarkastelussa vastemuuttujaa (response variable) merkitään y:llä ja faktoreita A, B, C,... 1
2 Esimerkki 6.1: Tarkastellaan seoksen väkevyysasteen (A, prosennteina) ja katalyytin määrän (B, kilogrammoina) vaikutusta kemiallisessa prosessissa saatavan tuotoksen määrään (y, mitattu sopivassa yksikössä). A: 15% ( low = 1 ), 25% ( high = + 1 ) B: 0.5kg ( low = 1 ), 1kg ( high = + 1 ). Toistoja: n = 3, Data: ============================================================= Toisto Kasittely A B kombinaatio I II III Total A low, B low A high, B low A low, B high A high, B high ============================================================= 2
3 Koe on satunnaistettu siten, että jokaisella toistolla permutoidaan ensin rivit satunnaisesti ja tehdään käsittelyt (runs). Matriisia sanotaan designmatriisiksi. Factor Run A B Analyysi toteutetaan kuten edellisessä kappaleessa. 3
4 SAS-ajo: options ls = 80; data chemicalprocess; input A B label A = "Reactant concentration (15% = low, 25% = high)" B = "Catalyst (0.5kg = low, 1kg = high)" y = "Yield"; datalines; ; run; Title "2ˆ2 factorial example"; proc glm data = chemicalprocess; class A B; model y = A B A*B; run; 4
5 Tulokset The GLM Procedure Class Level Information Class Levels Values A B Number of Observations Read 12 Number of Observations Used 12 2ˆ2 factorial example The GLM Procedure Dependent Variable: y Yield Sum of Source DF Squares Mean Square F Value Pr > F Model Error Total R-Square Coeff Var Root MSE y Mean Source DF Type III SS Mean Square F Value Pr > F A <.0001 B A*B Yhdysvaikutus ei ole tilastollisesti merkitsevä, joten se voidaan jättää pois mallista. 5
6 Kun faktorit ovat kvantitatiivisia, voidaan käyttää myös regressioanalyysia. Tulokseksi saadaan n.s. vastepinta (response surface), jota voidaan käyttää ennustamaan y:n arvoja millä tahansa väkevöitysasteella ja katalyytin määrällä. Jättämällä yhdysvaikutustekijä pois, on estimoitava regressiomlli muotoa (1) y = β 0 + β A A + β B B + ε. proc glm data = chemicalprocess; model y = A B; run; R-Square Coeff Var Root MSE y Mean Parameter Estimate Error t Value Pr > t Intercept A <.0001 B
7 Huom. 6.1: Edellä esitetty designmatriisi on ortogonaalinen (A:n ja B:n sisätulo on nolla). Tällaista koeasetelmaa sanotaan ortogonaaliseksi (toistoja n kappaletta kaikilla faktoritasojen kombinaatioilla). Huom. 6.2: Regressioanalyysi voidaan toteuttaa myös käyttämällä designmatriisin sarakkeita sellaisenaan selittävinä muuttujina. Yhdysvaikutustekijää vastaava selittävä muuttuja on tällöin A B = Laadullisesti kaikki vaihtoehdot (ANOVA, response surface, regression) johtavat samaan tulokseen. 7
8 Esim. 6.2: Määritellään { 1, jos A = 15 x 1 = 1, jos A = 25 jolloin regressiomalli on x 2 = { 1, jos B = 0.5 1, jos B = 1 y = β 0 + β 1 x 1 + β 2 x 2 + β 12 x 1 x 2 + ε. data cp2; * Muodostetaan uusi tiedosto; set chemicalprocess; if (a = 15) then x1 = -1; else x1 = 1; if (b = 1) then x2 = -1; else x2 = 1; run; Title "2ˆ2 factorial as a regression model"; proc glm; model y = x1 x2 x1*x2; run; 8
9 Dependent Variable: y Yield Sum of Source DF Squares Mean Square F Value Pr > F Model Error Corrected R-Square Coeff Var Root MSE y Mean Source DF Type III SS Mean Square F Value Pr > F x <.0001 x x1*x Standard Parameter Estimate Error t Value Pr > t Intercept <.0001 x <.0001 x x1*x
10 Yleinen 2 k malli Yleisessä 2 k faktorikokeen asetelmassa (factorial design) on k päävaikutusta, k 3 k 2 ) ) toisen asteen yhdysvaikutustermiä, kolmannen asteen yhdysvaikutustermiä, yksi k:n tekijän yhdysvaikutustermi. Yhteensä termejä on 2 k 1 (yleiskeskiarvon lisäksi). Yhdelläkin toistolla kokeita on tehtävä 2 k kappaletta, jotta kaikki vaihtoehdot tulee testatuksi. 10
11 Kokeen toteuttamiseksi laaditaan ensin standardi designmatriisi (standard design matrix), joka saadaan lisäämällä faktori kerrallaan ja yhdistämällä se muihin faktoreihin. Esimerkki 6.2: 2 4 faktorikokeen standardi designmatriisi ============================ Factor Row A B C D ============================ ============================ Satunnaistaminen toteutetaan permutoimalla rivit satunnaiseen järjestykseen. 11
12 Varianssitaulu (toistoja n): Source SS df MS F Main effect A SS A 1 MS A MS A MS err Main effect B SS B 1 MS B MS B MS err Main effect C SS C 1 MS C MS C MS err Main effect D SS D 1 MS D MS D MS err Interaction AB SS AB 1 MS AB MS AB MS err Interaction AC SS AC 1 MS AC MS AC MS err Interaction AD SS AD 1 MS AD MS AD MS err Interaction BC SS BC 1 MS BC MS BC MS err Interaction BD SS BD 1 MS BD MS BD MS err Interaction CD SS CD 1 MS CD MS CD MS err Interaction ABC SS ABC 1 MS ABC MS ABC MS err Interaction ABD SS ABD 1 MS ABD MS ABD MS err Interaction ACD SS ACD 1 MS ACD MS ACD MS err Interaction BCD SS BCD 1 MS BCD MS BCD MS err Interaction ABCD SS ABCD 1 MS ABCD MS ABCD MS err Error SS err 2 k (n 1) MS err Total SS tot 2 4 n 1 12
13 Huom. 6.3: Koska pää- ja yhdysvaikutustermien vapausasteet ovat 1, SS ja MS ovat samat. MS err = SS err /[16(n 1)] (2 4 = 16). 13
14 2 k kokeen toteutus: 1. Estimoidaan faktoriefektit 2. Muodostetaan perusmalli a) jos toistoja, estimoidaan täysi malli b) jos ei toistoja, valitaan tekijät normaalijakaumatestillä 3. Testataan tekijöiden tilastolliset merkitsevyydet 4. Poistetaan tarpeettomat tekijät ja estimoidaan lopullinen malli 5. Analysoidaan residuaalit 6. Tulkitaan mallin tulokset 14
15 Esimerkki 6.3: Nikkelin ja titaniumin seoksesta valmistetun metallin (mm. lentokoneen moottoreissa) murtumat. Taustatekijöitä: A pouring temperature, B titanium content, C heat treatment method ja D amount of grain refiner used. Vastemuuttuja y the length of crack in mm 10 2 induced in a sample coupon subject to a standard test. Toistoja n = 2 jokaisella käsittelykombinaatiolla. Kysymyksessä on 2 4 täysin satunnaistettu faktorikoe. 15
16 Design matriisi, käsittelyjärjestykset ja mittaukset: ==================================================== Run order Replicate A B C D Repl I Repl II I II ===================================================== 16
17 SAS-analyysi options ls = 80; data titanium; input /* muodostetaan design matriisi*/ if (mod(int((_n_+1)/2),2)=0) then A = 1; else A = -1; if (mod(int((_n_+1)/2),4)=0) (mod(int((_n_+1)/2)+1,4)=0) then B = 1; else B = -1; if (mod(int((_n_+1)/2),8)=0) (mod(int((_n_+1)/2)+1,8)=0) (mod(int((_n_+1)/2)+2,8)=0) (mod(int((_n_+1)/2)+3,8)=0) then C = 1; else C = -1; if (int((_n_+1)/2) < 9) then D = -1; else D = 1; label y = "Crack length (mm x 10e-2)" A = "Pouring temperature" B = "Titanium content" C = "Heat treatment method" D = "Grain refiner used"; datalines; ; run; 17
18 Title "Nickel-titan alloy cracks data (2ˆ4 faktorial design)"; proc glm data = titanium; class A B C D; model y = A B C D; run; 18
19 Nickel-titan alloy cracks data (2ˆ4 faktorial design) The GLM Procedure Class Level Information Class Levels Values A B C D Number of Observations Read 32 Number of Observations Used 32 The GLM Procedure Dependent Variable: y Crack length (mm x 10e-2) Sum of Source DF Squares Mean Square F Value Pr > F Model <.0001 Error Corrected R-Square Coeff Var Root MSE y Mean Source DF Type III SS Mean Square F Value Pr > F A <.0001 B <.0001 A*B <.0001 C <.0001 A*C <.0001 B*C A*B*C <.0001 D <.0001 A*D B*D A*B*D C*D A*C*D B*C*D A*B*C*D
20 Mikään interaktiotekijä, jossa D on mukana, ei ole tilastollisesti merkitsevä. Kolmannen asteen tekijöistä ABC on tilastollisesti merkitsevä. Yleinen tapa on, että pysytelään hierarkisissa malleissa, jolloin korkeinta astetta olevan termin kaikki alemmat termit säilytetään lopullisessa mallissa. Poistamalla muut tilastollisesti ei-merkitsevät tekijät estimoidaan seuraavaksi malli, jossa on ABC ja kaikki alemman asteen termit sekä D:n päävaikutus (main effect). Regressioestimoinnilla saadaan myös kertoimet. 20
21 Nickel-titan alloy cracks data (2ˆ4 faktorial design) The GLM Procedure Dependent Variable: y Crack length (mm x 10e-2) Sum of Source DF Squares Mean Square F Value Pr > F Model <.0001 Error Corrected R-Square Coeff Var Root MSE y Mean Source DF Type III SS Mean Square F Value Pr > F A <.0001 B <.0001 A*B <.0001 C <.0001 A*C <.0001 B*C A*B*C <.0001 D <.0001 Standard Parameter Estimate Error t Value Pr > t Intercept <.0001 A <.0001 B <.0001 A*B <.0001 C <.0001 A*C <.0001 B*C A*B*C <.0001 D <
22 Tekijän C, heat treatment method, vaikutus on negatiivinen samoin kuin AC interactioterimin. Tarkastellaan seuraavaksi mallin riittävyyttä. Normaalisuus on jokseenkin ok, eikä heteroskedastisuutta ole havaittavissa. 22
23 Jos tavoitteena on saada seos, jossa murtumat (cracks) ovat mahdollisimman pieniä, löytyy kombinaatio suoraan etsimällä vaihtoehto, jossa keskiarvo on pienin. Yleisessä tapauksessa tämä ja muut vaihtoehdot saadaan ennustettua regressiomallia, jonka kerroinestimaatit on tulostuksen alimmassa taulukossa. Alla on ennusteet eri kombinaatioilla. Minimi löytyy tekijäntasoilla A = 1, B = -1, C = 1, D = -1 y = 4.2 ja ˆy 2121 = 4.1. Ero (pieni) keskiarvon ja regressioennusteen välillä johtuu siitä, että malli ei ole saturoitu (saturoitu malli = malli, jossa kaikki päävaikutus ja yhdysvaikutustermit) 23
24 ===================================== A B C D mean(y) pred (y) ==================================== 24
25 Jos yhdysvaikutstekijöitä ei huomioitaisi, päävaikutusten ( yksi tekijä kerrallaan asetelma) johtaisi, tilanteeseen, jossa malli ennustaisi parhaan tuloksen käsittelykombinaatiolla A = -1, B = -1, C = 1, D = -1, y pred = 5.7, kun tilastollisesti merkitsevät yhdysvaikutusterimit sisältävä malli ennustaa y pred = 10.2! 25
26 Tarkastellaan vielä yhdysvaikutustermejä hieman lähemmin. Tarkastellaan AB, AC, BC ja ABC yhdysvaikutuksia. Erityisesti BC ei ole tilastollisesti merkitsevä. Jos yhdysvaikutusta ei ole, niin kyseisten tekijöiden vaikutus vastemuuttujaan on samansuuntaista (parallel) siiryttäessä käsittelyn tasolta toiselle. Yhdysvaikutuksen tapauksessa profiilien suunnat poikkeavat toisistaan. Profiels of A class means given B treatment Profiels of A class mean profiles given C treatment Profiels of B class mean profiles given C treatment Class mean Class mean Class mean A- A+ B B A- A+ C C B- B+ C C B:n ja C:n välillä ei siis ole yhdysvaikutusta. 26
27 Tarkastellaan seuraavkasi ABC yhdysvaikutusta. BC for A = -1 BC for A = +1 BC for A combined Class mean 10.0 Class mean Class mean B- B+ C= C = B- B+ C= C = B- B+ C= C = A:n luokissa B:n keskiarvoprofiilit eivät ole saman suuntaisia, kun taas aggregoitaessa A:n yli, profiilit ovat samansuuntaisest (viimeinen kuvio oikealla, joka on sama kuin BC-kuvio edellä). Tämä on osoitus kolmannen asteen iteraktiosta (ABC). 27
28 Jos kaikki yllä olevat profiilit olisivat saman samanlaisia, se olisi osoitus ABC yhdysvaikutuksen puuttumisesta. Jos kaikki ovat samansuuntaisia, puuttuuvat kaikki yhdysvaikututekijät. D:ltä puuttuu kaikki interaktiotermit. Kuviona tämä näyttää seuraavalta. (esimerkiksi BD ja ABD). BD for A = -1 BD for A = +1 BD for A combined Class mean 10.0 Class mean Class mean B- B+ D= D = B- B+ D= D = B- B+ D= D =
29 2 k asetelma: yksi toisto (n = 1) Faktoreiden lukumäärän k kasvaessa, kasvaa käsittelyykombinaatioiden määrä nopeasti. Esimerkiksi, jos k = 5, niin 2 5 = 32 kombinaatiota, jos k = 6, niin 2 6 = 64 kombinaatiota. Tällaisissa tapauksissa turvaudutaan usien vain yhteen toistoon (n = 1). Täyden mallin (saturated) yhdysvaikutusten testausta ei tällöin voida toteuttaa, koska residuaalivarianssin estimoimiseksi ei riitä vapausasteita. 29
30 Kuitenkin, jos korkeimpien asteiden yhdysvaikutuksia ei esiinny voidaan niiden vapausasteet käyttää residuaalivarianssin estimointiin. Normaalijakauman todennäköisyyskuviota (normal probability plot) voidaan käyttää päättämään minkä termien estimaatit ovat katsottavissa pelkästään satunnaisvaihteluksi (satunnaiskohinaksi). 30
31 Esimerkki 6.4: Kemiallista tuotetta valmistetaan paineastiassa suodattamalla. Tavoiteena on parantaa suodatusnopeutta nykyisestä n. 75 gal/h. Faktorikokeella tutkitaan suodatusnopeuteen vaikuttavia tekijöitä. Vastemuuttuja: y: suodatusnopeus (filtration rate gal/h) Faktorit: A: Lämpötila (temperature) B: Paine (pressure) C: Formalehydikonsentraatio (concentration of formaldehyde) D: Sekoitusnopeus? (stirring rate) 31
32 Havainnot: ================ A B C D y ================ 32
33 Regressiokerroinestimaatit: ========================== Parameter Estimate Intercept A B A*B C A*C B*C A*B*C D A*D B*D A*B*D C*D A*C*D B*C*D A*B*C*D ========================== 33
34 Kerroinestimaattien Normal probability plot: 3 2 Standardized Normla Variate AC C D AD A Effect estimate Suoralla olevat kertoimet ovat tilastollisesti merkityksettömiä. Estimoidaan malli, jossa on tekijöiden A, C ja D päävaikutukset sekä yhdysvaikututermit AC ja AD. 34
35 Erityisesti, koska B eikä mitkään siihen liittyvät yhdysvaikutustermit osoittaudu tilastollisesti merkittäviksi, jää B kokonaisuudessaan pois. Tällöin koetilanne voidaan itse asiassa ajatella 2 3 asetelmana, jossa muodostuu kaksi toistoa (n = 2) (hidden replication) jokaiseen soluun. Alla on tulokset näin syntyneen 2 3 saturoidusta mallista. Tulokset vahvistavat edelleen, etteivät myöskään CD ja ACD ole tilastollisesti merkitseviä, joten ne voidaan poistaa myös lopullisesta mallista. 35
36 Saturoidun mallin variannsitaulu: Source DF Squares Mean Square F Value Pr > F Model <.0001 Error Corrected R-Square Coeff Var Root MSE y Mean Source DF Type III SS Mean Square F Value Pr > F A <.0001 C A*C <.0001 D A*D C*D A*C*D
37 Lopullisen mallin estimaatit: The GLM Procedure Dependent Variable: y Filtration rate (gal/h) Sum of Source DF Squares Mean Square F Value Pr > F Model <.0001 Error Corrected R-Square Coeff Var Root MSE y Mean Source DF Type III SS Mean Square F Value Pr > F A <.0001 C D <.0001 A*C <.0001 A*D <.0001 Standard Parameter Estimate Error t Value Pr > t Intercept <.0001 A <.0001 C D <.0001 A*C <.0001 A*D <
38 Residuaalien normaalisuuskuvion (Normal probability plot) perusteella ei esiinny merkittäviä poikkeamia, joten malli näiltä osin näyttäisi olevan riittävä. 38
39 Estimoitu regressiomalli on siis muotoa: (2) ˆy = A C D 9.06 AC AD Havaitaan jälleen, että tuotannon maksimin määrittämisessä yhdysvaikutustekijät ovat avainasemassa. Jos tarkastellaan vain päävaikutuksia, maksimi saavutettaisiin, kun A = C = D = 1, jolloin läpäisy päävaikutuksilla ennustettuna olisi , (täyden mallin ennuste , eli liki sama, johtuen siitä, että ja 8.32 käytännöllisesti katsoen kumoavat toisensa). Kuitenkin AC:n kerroin on negatiivinen, jolloin valitsemalla A tai C negatiiviseksi, muuttuu vaikutus positiiviseksi. Tässä kannattaa valita C negatiiviseksi. Maksimi löytyy tekijöiden ääriarvoista (±1) valitsemalla A = 1, C = 1, D = 1, jolloin ˆy =
40 Huom. 6.4: Kun faktorit ovat kvantitatiivisa, voidaan vali [ 1, 1] ajatella ääripäiksi, jossa skaalaamalla uudestaan alaraja ilmaisee %-osuuden faktorin maksimiarvosta ja yläraja 100%. 40
41 Esimerkki 6.5: Data transformation in Factorial Design. Tarkastella jälleen 2 4 koetta, jossa on vain yksi toisto. Vastemuuttuja (Response): y: Advance rate of a dill Faktorit: A: Drill load B: Flow rate C: Rotational speed D: Drilling mud used 41
42 Saturoidun mallin faktoreiden estimaatit: ========================== Parameter Estimate A B A*B C A*C B*C A*B*C D A*D B*D A*B*D C*D A*C*D B*C*D A*B*C*D ========================== 42
43 Normaalisuuskuvio: Normal Probability Plot of Effect Coefficients 3 2 C B Standard normal deviate BD BC D Estimate Kuvion mukaan merkittäviä tekijöitä ovat B, C, D, BC ja BD. 43
44 Estimoitaessa vastaava malli, jäännöskuviot ovat seuraavat: Kuvioiden perusteella virhtemin varianssi ei näytä olevan vakio eikä normaalisuus toteudu. Koska vastemuuttuja on nopeus (rate), log-muunnos y = log y, jossa log on luonnollinen logaritmi, on yleisesti järkevä vaihtoehto. 44
45 Muunnetun mallin kertoimien normaalikuvion perusteella vain B, C ja D päävaikutukset ovat merkityksellisiä. Normal Probability Plot of Factor Effects 3 B 2 C D Normal variable value Factor effect 45
46 Estimointitulokset: Dependent Variable: yl log dill rate Sum of Source DF Squares Mean Square F Value Pr > F Model <.0001 Error Corrected R-Square Coeff Var Root MSE yl Mean Source DF Type III SS Mean Square F Value Pr > F B <.0001 C <.0001 D Standard Parameter Estimate Error t Value Pr > t Intercept <.0001 B <.0001 C <.0001 D
47 Jäännöstarkastelut (mallin riittävyys) Kuvioiden perusteella kaikki malli on näiltä osin ok. Lopputuloksena on, että vain faktoreiden Flow, Speed ja Mud päävaikutuksilla on merkitystä. Yhdysvaikutuksen puuttuessa, niitä voidaan säädellä toisistaan riippumatta poraustulosta optimoitaessa. 47
48 Keskipistearvon lisääminen 2 k koeasetelmaan 2 k faktorikokeissa implisiittisenä oletuksena on, että faktoreiden vaikutus on lineaarista. Osittain yhdysvaikutustermin kautta voidaan huomioida mahdollista epälineaarisuutta. Toteuttamalla kokeet myös faktorin 1 ja +1 arvojen lisäksi myös nolla -arvolla saadaan tutkittua mahdollista epälineaarista vaikutusta vastemuuttujaan. Huom. 6.5: Oletuksena tässä lähestymistavassa on, että faktorit ovat kvantitatiivisia. Estimoitava malli ajatellaan olevan muotoa: (3) k y = β 0 + β i x i + k βij x i x j + β jj x 2 j + ε j=1 i<j i=1 Testatttava hypoteesi (4) H 0 : β 11 = = β kk = 0. 48
49 Teknisesti tämä onnistuu lisäämällä yksi faktoritaso lisää. Keskipistetasolla (kaikki faktorit nolla-tasolla) toistoja tehdään n c kappaletta, jotka satunnaistetaan kokeen suunnitteluvaiheessa tavanomaiseen tapaan. 49
50 Esimerkki 6.6: Oletetaan, että suodatusesimerkissä (Esim. 6.4) keskipistetasolla (0, 0, 0, 0) on tehty neljä toistoa, joista on saatu arvot 73, 75, 66 ja 69. Määritellään uusi muuttuja cp = 1, kun center point havainto ja cp = 0 muuten. SAS-toteutus on seuraava: proc glm:ssä analyysi totetutetaan regressioestimoinnilla (kvantitatiiviset faktorit). 50
51 options ls = 80; data filtration; input A B C D cp y; label y = "Filtration rate (gal/h)" A = "Temperature" B = "Pressure" C = "Concentration of formaldehyde" D = "Stirring rate" cp = "Center point"; datalines; ; run; Title "Filtration example with center point"; Proc glm data = filtration; model y = A B C D cp /ss3; run; 51
52 Saturoidun mallin tulokset: The GLM Procedure Dependent Variable: y Filtration rate (gal/h) Sum of Source DF Squares Mean Square F Value Pr > F Model Error Corrected R-Square Coeff Var Root MSE y Mean Source DF Type III SS Mean Square F Value Pr > F A B A*B C A*C B*C A*B*C D A*D B*D A*B*D C*D A*C*D B*C*D A*B*C*D cp
53 Center point taso ei ole tilastolliseti merkitsevä (p-arvo 0.78), joten tekijöillä ei ole epälineaarisuutta (kvadraattisia tekijöitä), eli nollahypoteesia ei hylätä. H 0 : β 11 = = β 44 = 0 Havaitaan jälleen, että vain tekijät A, C, D, AC ja AD ovat tilastolliseti merkitseviä. 53
6. 2 k faktorikokeet. Lähtökohta: k faktoria, kullakin kaksi tasoa ("high", "low"). määrä per faktoritasokombinaatio (balansoidussa)kokeessa.
6. 2 k faktorikokeet Lähtökohta: k faktoria, kullakin kaksi tasoa ("high", "low"). Vähintään 2 k havaintoa, jotta kaikki vaihtoehdot tulee katettua (complete replicate). Havaintojen kokonaismäärä N =2
Lisätiedot6. 2 k faktorikokeet. Lähtökohta: k faktoria, kullakin kaksi tasoa ("high", "low"). määrä per faktoritasokombinaatio (balansoidussa)kokeessa.
6. 2 k faktorikokeet Lähtökohta: k faktoria, kullakin kaksi tasoa ("high", "low"). Vähintään 2 k havaintoa, jotta kaikki vaihtoehdot tulee katettua (complete replicate). Havaintojen kokonaismäärä N =2
LisätiedotLohkotekijät muodostuvat faktoreista, joiden suhteen ei voida tehdä (täydellistä) satunnaistamista.
7. Lohkominen ja sulautus 2 k kokeissa Lohkominen (Blocking) Lohkotekijät muodostuvat faktoreista, joiden suhteen ei voida tehdä (täydellistä) satunnaistamista. Esimerkiksi faktorikokeessa raaka-aine-erät
Lisätiedot7. Lohkominen ja sulautus 2 k kokeissa. Lohkominen (Blocking)
7. Lohkominen ja sulautus 2 k kokeissa Lohkominen (Blocking) Lohkotekijät muodostuvat faktoreista, joiden suhteen ei voida tehdä (täydellistä) satunnaistamista. Esimerkiksi faktorikokeessa raaka-aine-erät
Lisätiedot7. Lohkominen ja sulautus 2 k kokeissa. Lohkominen (Blocking)
7. Lohkominen ja sulautus 2 k kokeissa Lohkominen (Blocking) Lohkotekijät muodostuvat faktoreista, joiden suhteen ei voida tehdä (täydellistä) satunnaistamista. Esimerkiksi faktorikokeessa raaka-aine-erät
Lisätiedotproc glm data = ex61; Title2 "Aliasing Structure of the 2_IV^(5-1) design"; model y = A B C D E /Aliasing; run; quit;
Title "Exercises 6"; Data ex61; input A B C D E y @@; Label A = "Furnance Temperature" B = "Heating Time" C = "Transfer Time" D = "Hold Down Time" E = "Quench of Oil Temperature" y = "Free Height of Leaf
LisätiedotFaktorikokeilla tarkoitetaan koesuunnitelmaa, jossa koe toistetaan kaikilla faktoreiden tasojen kombninaatioilla.
5. Johdatus faktorikokeisiin 5.1 Taustaa Faktorikokeilla tarkoitetaan koesuunnitelmaa, jossa koe toistetaan kaikilla faktoreiden tasojen kombninaatioilla. Täten, jos faktorilla A on a tasoa ja faktorilla
Lisätiedot5. Johdatus faktorikokeisiin. Tekijän omaa vaikutusta vastemuuttujaan sanotaan. 5.1 Taustaa
5. Johdatus faktorikokeisiin 5.1 Taustaa Faktorikokeilla tarkoitetaan koesuunnitelmaa, jossa koe toistetaan kaikilla faktoreiden tasojen kombninaatioilla. Täten, jos faktorilla A on a tasoa ja faktorilla
Lisätiedot2 k -faktorikokeet. Vilkkumaa / Kuusinen 1
2 k -faktorikokeet Vilkkumaa / Kuusinen 1 Motivointi 2 k -faktorikoe on k-suuntaisen varianssianalyysin erikoistapaus, jossa kaikilla tekijöillä on vain kaksi tasoa, matala (-) ja korkea (+). 2 k -faktorikoetta
Lisätiedot5. Johdatus faktorikokeisiin. Tekijän omaa vaikutusta vastemuuttujaan sanotaan. 5.1 Taustaa
5. Johdatus faktorikokeisiin 5.1 Taustaa Faktorikokeilla tarkoitetaan koesuunnitelmaa, jossa koe toistetaan kaikilla faktoreiden tasojen kombninaatioilla. Täten, jos faktorilla A on a tasoa ja faktorilla
LisätiedotKeskipisteen lisääminen 2 k -faktorikokeeseen (ks. Montgomery 9-6)
Mat-.3 Koesuunnittelu ja tilastolliset mallit kevät Keskipisteen lisääminen k -faktorikokeeseen (ks. Montgomery 9-6) Esim (Montg. ex. 9-, 6-): Tutkitaan kemiallisen prosessin saannon Y riippuvuutta faktoreista
Lisätiedot9.1 Hierarkiset asetelmat (Nested Designs)
9. Muita koeasetelmia 9.1 Hierarkiset asetelmat (Nested Designs) Tietyissä koetilanteissa yhden faktorin tasot ovat samanlaisia joskaan ei täysin identtisiä toisen faktorin eri tasoilla. Tällaista asetelmaa
Lisätiedotnopeasti täydessä toteutuksessa (complete replicate).
8. Osittaiset 2 k faktorikokeet Faktoreiden lukumäärän k kasvaessa 2 k koeasetelmassa kasvaa koetoistojen (runs) määrää nopeasti täydessä toteutuksessa (complete replicate). Esimerkiksi 2 6 asetelman täysi
LisätiedotKaksitasoiset hierarkiset asetelmat (Two-Stage Nested Designs) 9. Muita koeasetelmia. 9.1 Hierarkiset asetelmat (Nested Designs)
9. Muita koeasetelmia 9.1 Hierarkiset asetelmat (Nested Designs) Tietyissä koetilanteissa yhden faktorin tasot ovat samanlaisia joskaan ei täysin identtisiä toisen faktorin eri tasoilla. Tällaista asetelmaa
Lisätiedot8. Osittaiset 2 k faktorikokeet. Niinpä, jos voidaan olettaa, että korekeamman
8. Osittaiset 2 k faktorikokeet Faktoreiden lukumäärän k kasvaessa 2 k koeasetelmassa kasvaa koetoistojen (runs) määrää nopeasti täydessä toteutuksessa (complete replicate). Esimerkiksi 2 6 asetelman täysi
LisätiedotTavoite on eliminoida sen vaikutus koetuloksista. 4. Satunnaistetut lohkokokeet, latinalaiset neliöt ja vastaavat asetelmat. Eliminointimenetelmiä:
4. Satunnaistetut lohkokokeet, latinalaiset neliöt ja vastaavat asetelmat 4.1 Satunnaistettu lohkokoe (Randomized Block Design) Kiusatekijä (nuisance factor): Kiusatekijä on taustatekijä, joka voi vaikuttaa
LisätiedotOsafaktorikokeet. Heliövaara 1
Osafaktorikokeet Heliövaara 1 Osafaktorikokeet Kun faktorien määrä 2 k -faktorikokeessa kasvaa, tarvittavien havaintojen määrä voi ylittää kokeentekijän resurssit. Myös estimoitavien korkean asteen yhdysvaikutustermien
LisätiedotA250A0050 Ekonometrian perusteet Tentti
A250A0050 Ekonometrian perusteet Tentti 28.9.2016 Tentissä ei saa käyttää laskinta. Tentistä saa max 80 pistettä. Hyväksytysti suoritetusta harjoitustyöstä saa max 20 pistettä. Huom. Merkitse vastauspaperin
Lisätiedot9. Muita koeasetelmia. Kaksitasoiset hierarkiset asetelmat (Two-Stage Nested Designs) 9.1 Hierarkiset asetelmat (Nested Designs)
9. Muita koeasetelmia 9.1 Hierarkiset asetelmat (Nested Designs) Tietyissä koetilanteissa yhden faktorin tasot ovat samanlaisia joskaan ei täysin identtisiä toisen faktorin eri tasoilla. Tällaista asetelmaa
LisätiedotKoesuunnittelu 2 k -faktorikokeet. TKK (c) Ilkka Mellin (2005) 1
Koesuunnittelu 2 k -faktorikokeet TKK (c) Ilkka Mellin (2005) 2 k -faktorikokeet 2 2 -faktorikokeet 2 3 -faktorikokeet 2 k -faktorikokeet TKK (c) Ilkka Mellin (2005) 2 2 k -faktorikokeet: Mitä opimme?
LisätiedotTässä harjoituksessa käydään läpi R-ohjelman käyttöä esimerkkidatan avulla. eli matriisissa on 200 riviä (havainnot) ja 7 saraketta (mittaus-arvot)
R-ohjelman käyttö data-analyysissä Panu Somervuo 2014 Tässä harjoituksessa käydään läpi R-ohjelman käyttöä esimerkkidatan avulla. 0) käynnistetään R-ohjelma Huom.1 allaolevissa ohjeissa '>' merkki on R:n
LisätiedotVARIANSSIANALYYSI ANALYSIS OF VARIANCE
VARIANSSIANALYYSI ANALYSIS OF VARIANCE 1 Suomalaisten aikuisten pituusjakauma:.8.7.6.5.4.3.2.1 14 15 16 17 18 19 2 21 Jakauma ei ole normaali, sen olettaminen sellaiseksi johtaa virheellisiin päätelmiin.
LisätiedotOsafaktorikokeet. Kurssipalautetta voi antaa Oodissa Kuusinen/Heliövaara 1
Osafaktorikokeet Kurssipalautetta voi antaa Oodissa 27.4.-25.5. Kuusinen/Heliövaara 1 Osafaktorikokeet Kun faktorien määrä 2 k -faktorikokeessa kasvaa, tarvittavien havaintojen määrä voi ylittää kokeen
LisätiedotVastepintamenetelmä. Kuusinen/Heliövaara 1
Vastepintamenetelmä Kuusinen/Heliövaara 1 Vastepintamenetelmä Vastepintamenetelmässä pyritään vasteen riippuvuutta siihen vaikuttavista tekijöistä approksimoimaan tekijöiden polynomimuotoisella funktiolla,
Lisätiedot[MTTTA] TILASTOMENETELMIEN PERUSTEET, KEVÄT 209 https://coursepages.uta.fi/mttta/kevat-209/ HARJOITUS 5 viikko 8 RYHMÄT: ke 2.5 3.45 ls. C6 Leppälä to 08.30 0.00 ls. C6 Korhonen to 2.5 3.45 ls. C6 Korhonen
Lisätiedot4. Satunnaistetut lohkokokeet, latinalaiset neliöt ja vastaavat asetelmat. Kiusatekijä on taustatekijä, joka voi vaikuttaa
4. Satunnaistetut lohkokokeet, latinalaiset neliöt ja vastaavat asetelmat 4.1 Satunnaistettu lohkokoe (Randomized Block Design) Kiusatekijä (nuisance factor): Kiusatekijä on taustatekijä, joka voi vaikuttaa
LisätiedotKaksisuuntaisen varianssianalyysin tilastollisessa malli voidaan esittää seuraavassa muodossa:
Mat-.03 Koesuunnittelu ja tilastolliset mallit Mat-.03 Koesuunnittelu ja tilastolliset mallit / Ratkaisut Aiheet: Avainsanat: Kaksisuuntainen varianssianalsi Aritmeettinen keskiarvo, Estimointi, F-testi,
Lisätiedot3. Yhden faktorin kokeet. 3.1 Varianssianalyysi. Yhden faktorin koeasetelma, jossa faktorilla on a tasoa (kokeessa on a käsittelyä).
3. Yhden faktorin kokeet 3.1 Varianssianalyysi Yhden faktorin koeasetelma, jossa faktorilla on a tasoa (kokeessa on a käsittelyä). Esimerkki 3.1: Tutkitaan kankaassa käytettävän synteettisen kuidun vetolujuutta,
Lisätiedot3. Yhden faktorin kokeet. 3.1 Varianssianalyysi. Yhden faktorin koeasetelma, jossa faktorilla on a tasoa (kokeessa on a käsittelyä).
3. Yhden faktorin kokeet 3.1 Varianssianalyysi Yhden faktorin koeasetelma, jossa faktorilla on a tasoa (kokeessa on a käsittelyä). Esimerkki 3.1: Tutkitaan kankaassa käytettävän synteettisen kuidun vetolujuutta,
LisätiedotTilastollinen vastepintamallinnus: kokeiden suunnittelu, regressiomallin analyysi, ja vasteen optimointi. Esimerkit laskettu JMP:llä
Tilastollinen vastepintamallinnus: kokeiden suunnittelu, regressiomallin analyysi, ja vasteen optimointi Esimerkit laskettu JMP:llä Antti Hyttinen Tampereen teknillinen yliopisto 29.12.2003 ii Ohjelmien
LisätiedotVastepintamenetelmä. Vilkkumaa / Kuusinen 1
Vastepintamenetelmä Vilkkumaa / Kuusinen 1 Motivointi Varianssianalyysissa tutkitaan tekijöiden vaikutusta vasteeseen siten, että tekijöiden tasot on ennalta valittu. - Esim. tutkitaan kemiallisen prosessin
LisätiedotYhden faktorin koeasetelma, jossa faktorilla on a tasoa (kokeessa on a käsittelyä).
3. Yhden faktorin kokeet 3.1 Varianssianalyysi Yhden faktorin koeasetelma, jossa faktorilla on a tasoa (kokeessa on a käsittelyä). Esimerkki 3.1: Tutkitaan kankaassa käytettävän synteettisen kuidun vetolujuutta,
LisätiedotLohkoasetelmat. Vilkkumaa / Kuusinen 1
Lohkoasetelmat Vilkkumaa / Kuusinen 1 Motivointi 1/3 Kaksisuuntaisella varianssianalyysilla voidaan tutkia kahden tekijän A ja B vaikutusta sekä niiden yhdysvaikutusta tutkimuksen kohteeseen Kaksisuuntaisessa
LisätiedotToimittaja 1 2 3 Erä 1 2 3 4 1 2 3 4 1 2 3 4 1 2 2 1 1 0 1 0 2 2 1 3 1 3 0 4 2 4 0 3 4 0 1 2 0 4 1 0 3 2 2 2 0 2 2 1
Mat-.03 Koesuunnittelu ja tilastolliset mallit / Ratkaisut Aiheet: Avainsanat: Hierarkkiset koeasetelmat -faktorikokeet Vastepintamenetelmä Aritmeettinen keskiarvo, Estimaatti, Estimaattori, -testi, aktorikokeet,
LisätiedotKertausluento. Vilkkumaa / Kuusinen 1
Kertausluento Vilkkumaa / Kuusinen 1 Kokeellinen tutkimus Kokeellisessa tutkimuksessa on tavoitteena selvittää, miten erilaiset käsittelyt vaikuttavat tutkimuksen kohteisiin - Esim. miten lämpötila ja
LisätiedotLatinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt: Mitä opimme? Latinalaiset neliöt
TKK (c) Ilkka Mellin (005) Koesuunnittelu TKK (c) Ilkka Mellin (005) : Mitä opimme? Tarkastelemme tässä luvussa seuraavaa kysymystä: Miten varianssianalyysissa tutkitaan yhden tekijän vaikutusta vastemuuttujaan,
LisätiedotKoesuunnittelu Vastepintamenetelmä. TKK (c) Ilkka Mellin (2005) 1
Koesuunnittelu Vastepintamenetelmä TKK (c) Ilkka Mellin (2005) 1 Vastepintamenetelmä Vastepintamenetelmä: Johdanto 2 k -faktorikokeet Vastefunktion kaarevuuden testaaminen 1. asteen vastepintamallin varianssianalyysihajotelma
LisätiedotRegressioanalyysi. Vilkkumaa / Kuusinen 1
Regressioanalyysi Vilkkumaa / Kuusinen 1 Regressioanalyysin idea ja tavoitteet Regressioanalyysin idea: Halutaan selittää selitettävän muuttujan havaittujen arvojen vaihtelua selittävien muuttujien havaittujen
Lisätiedot2. Keskiarvojen vartailua
2. Keskiarvojen vartailua Esimerkki 2.1: Oheiset mittaukset liittyvät Portland Sementin sidoslujuuteen (kgf/cm 2 ). Mittaukset y 1 ovat nykyisestä seoksesta ja mittaukset y 2 uudesta seoksesta, jossa lisäaineena
Lisätiedot1. PÄÄTTELY YHDEN SELITTÄJÄN LINEAARISESTA REGRESSIOMALLISTA
Mat-2.104 Tilastollisen analyysin perusteet / Ratkaisut Aiheet: Avainsanat Päättely yhden selittäjän lineaarisesta regressiomallista Ennustaminen, Ennuste, Ennusteen luottamusväli, Estimaatti, Estimaattori,
LisätiedotRegressioanalyysi. Kuusinen/Heliövaara 1
Regressioanalyysi Kuusinen/Heliövaara 1 Regressioanalyysin idea ja tavoitteet Regressioanalyysin idea: Oletetaan, että haluamme selittää jonkin selitettävän muuttujan havaittujen arvojen vaihtelun joidenkin
Lisätiedot4. Satunnaistetut lohkokokeet, latinalaiset neliöt ja vastaavat asetelmat. Tavoite on eliminoida sen vaikutus koetuloksista. Eliminointimenetelmiä:
4. Satunnaistetut lohkokokeet, latinalaiset neliöt ja vastaavat asetelmat Tavoite on eliminoida sen vaikutus koetuloksista. 4.1 Satunnaistettu lohkokoe (Randomized Block Design) Kiusatekijä (nuisance factor):
LisätiedotLohkoasetelmat. Heliövaara 1
Lohkoasetelmat Heliövaara 1 Kiusatekijä Kaikissa kokeissa, kokeen tuloksiin voi vaikuttaa vaihtelu joka johtuu kiusatekijästä. Kiusatekijä on tekijä, jolla mahdollisesti on vaikutusta vastemuuttujan arvoon,
LisätiedotJakaumien merkitys biologisissa havaintoaineistoissa: Löytyykö ratkaisu Yleistetyistä Lineaarisista (Seka)Malleista?
1 Hydrobiologian tutkijaseminaari 20.3.2000 Jakaumien merkitys biologisissa havaintoaineistoissa: Löytyykö ratkaisu Yleistetyistä Lineaarisista (Seka)Malleista? Jari Hänninen Turun yliopisto Saaristomeren
LisätiedotEsim Brand lkm keskiarvo keskihajonta A ,28 5,977 B ,06 3,866 C ,95 4,501
Esim. 2.1.1. Brand lkm keskiarvo keskihajonta A 10 251,28 5,977 B 10 261,06 3,866 C 10 269,95 4,501 y = 260, 76, n = 30 SS 1 = (n 1 1)s 2 1 = (10 1)5, 977 2 321, 52 SS 2 = (n 2 1)s 2 2 = (10 1)3, 8662
LisätiedotResiduaalit. Residuaalit. UK Ger Fra US Austria. Maat
TAMPEREEN YLIOPISTO Tilastollisen mallintamisen harjoitustyö Teemu Kivioja ja Mika Helminen Epätasapainoisen koeasetelman analyysi Worksheet 5 Matematiikan, tilastotieteen ja filosofian laitos Tilastotiede
Lisätiedot1. Tutkitaan tavallista kahden selittäjän regressiomallia
TA7, Ekonometrian johdantokurssi HARJOITUS 5 RATKAISUEHDOTUKSET 232215 1 Tutkitaan tavallista kahden selittäjän regressiomallia Y i = β + β 1 X 1,i + β 2 X 2,i + u i (a) Kirjoita regressiomalli muodossa
Lisätiedot(d) Laske selittäjään paino liittyvälle regressiokertoimelle 95 %:n luottamusväli ja tulkitse tulos lyhyesti.
2. VÄLIKOE vuodelta -14 1. Liitteessä 1 on esitetty R-ohjelmalla saatuja tuloksia aineistosta, johon on talletettu kahdenkymmenen satunnaisesti valitun miehen paino (kg), vyötärön ympärysmitta (cm) ja
LisätiedotTilastollisen analyysin perusteet Luento 9: Moniulotteinen lineaarinen. regressio
Tilastollisen analyysin perusteet Luento 9: lineaarinen lineaarinen Sisältö lineaarinen lineaarinen lineaarinen Lineaarinen Oletetaan, että meillä on n kappaletta (x 1, y 1 ), (x 2, y 2 )..., (x n, y n
LisätiedotVastepintamenetelmä. Heliövaara 1
Vastepintamenetelmä Kurssipalautteen antamisesta saa hyvityksenä yhden tenttipisteen. Palautelomakkeeseen tulee lähiaikoina linkki kurssin kotisivuille. Heliövaara 1 Vastepintamenetelmä Vastepintamenetelmässä
LisätiedotPerusnäkymä yksisuuntaiseen ANOVAaan
Metsämuuronen 2006. TTP Tutkimuksen tekemisen perusteet ihmistieteissä Taulukko.51.1 Analyysiin mukaan tulevat muuttujat Mja selite Merkitys mallissa F1 Ensimmäinen faktoripistemuuttuja Selitettävä muuttuja
LisätiedotOHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi. Luento 3
OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi Luento 3 Tutkimussuunnitelman rakenne-ehdotus Otsikko 1. Motivaatio/tausta 2. Tutkimusaihe/ -tavoitteet ja kysymykset
LisätiedotKaksisuuntainen varianssianalyysi. Heliövaara 1
Kaksisuuntainen varianssianalyysi Heliövaara 1 Kaksi- tai useampisuuntainen varianssianalyysi Kaksi- tai useampisuuntaisessa varianssianalyysissa perusjoukko on jaettu ryhmiin kahden tai useamman tekijän
LisätiedotTilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä
Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä arvon Sisältö arvon Bootstrap-luottamusvälit arvon arvon Oletetaan, että meillä on n kappaletta (x 1, y 1 ),
LisätiedotSovellettu todennäköisyyslaskenta B
Sovellettu todennäköisyyslaskenta B Antti Rasila 22. marraskuuta 2007 Antti Rasila () TodB 22. marraskuuta 2007 1 / 17 1 Epäparametrisia testejä (jatkoa) χ 2 -riippumattomuustesti 2 Johdatus regressioanalyysiin
LisätiedotYleistetyistä lineaarisista malleista
Yleistetyistä lineaarisista malleista Tilastotiede käytännön tutkimuksessa -kurssi, kesä 2001 Reijo Sund Klassinen lineaarinen malli y = Xb + e eli E(Y) = m, jossa m = Xb Satunnaiskomponentti: Y:n komponentit
LisätiedotData-analyysi II. Sisällysluettelo. Simo Kolppo [Type the document subtitle]
Data-analyysi II [Type the document subtitle] Simo Kolppo 26.3.2014 Sisällysluettelo Johdanto... 1 Tutkimuskysymykset... 1 Aineistojen esikäsittely... 1 Economic Freedom... 1 Nuorisobarometri... 2 Aineistojen
LisätiedotHierarkkiset koeasetelmat. Heliövaara 1
Hierarkkiset koeasetelmat Heliövaara 1 Hierarkkiset koeasetelmat Kaksiasteista hierarkkista koeasetelmaa käytetään tarkasteltaessa seuraavaa kysymystä: Miten varianssianalyysissa tutkitaan kahden tekijän
LisätiedotUSEAN MUUTTUJAN REGRESSIOMALLIT JA NIIDEN ANA- LYYSI
TEORIA USEAN MUUTTUJAN REGRESSIOMALLIT JA NIIDEN ANA- LYYSI Regressiomalleilla kuvataan tilanteita, jossa suureen y arvot riippuvat joukosta ns selittäviä muuttujia x 1, x 2,..., x p oletetun funktiomuotoisen
Lisätiedotxi = yi = 586 Korrelaatiokerroin r: SS xy = x i y i ( x i ) ( y i )/n = SS xx = x 2 i ( x i ) 2 /n =
1. Tutkitaan paperin ominaispainon X(kg/dm 3 ) ja puhkaisulujuuden Y (m 2 ) välistä korrelaatiota. Tiettyä laatua olevasta paperierästä on otettu satunnaisesti 10 arkkia ja määritetty jokaisesta arkista
LisätiedotLohkoasetelmat. Kuusinen/Heliövaara 1
Lohkoasetelmat Kuusinen/Heliövaara 1 Kiusatekijä Kaikissa kokeissa kokeen tuloksiin voi vaikuttaa vaihtelu, joka johtuu kiusatekijästä. Kiusatekijä on tekijä, jolla on mahdollisesti vaikutusta vastemuuttujan
LisätiedotSAS/IML käyttö ekonometristen mallien tilastollisessa päättelyssä. Antti Suoperä 16.11.2009
SAS/IML käyttö ekonometristen mallien tilastollisessa päättelyssä Antti Suoperä 16.11.2009 SAS/IML käyttö ekonometristen mallien tilastollisessa päättelyssä: Matriisi ja vektori laskennan ohjelmisto edellyttää
LisätiedotKaksisuuntainen varianssianalyysi. Vilkkumaa / Kuusinen 1
Kaksisuuntainen varianssianalyysi Vilkkumaa / Kuusinen 1 Motivointi Luennot 6 ja 7: yksisuuntaisella varianssianalyysilla testataan ryhmäkohtaisten odotusarvojen yhtäsuuruutta, kun perusjoukko on jaettu
Lisätiedot1. YKSISUUNTAINEN VARIANSSIANALYYSI: AINEISTON ESITYSMUODOT
Mat-2.104 Tilastollisen analyysin perusteet / Ratkaisut Aiheet: Avainsanat: Yksisuuntainen varianssianalyysi Bartlettin testi, Bonferronin menetelmä, F-testi, Jäännösneliösumma, χ 2 -testi, Kokonaiskeskiarvo,
Lisätiedot1. REGRESSIOMALLIN SYSTEMAATTISEN OSAN MUOTO
Mat-2.104 Tilastollisen analyysin perusteet / Ratkaisut Aiheet: Avainsanat: Regressiodiagnostiikka Cooken etäisyys, Funktionaalinen muoto, Diagnostinen grafiikka, Diagnostiset testit, Heteroskedastisuus,
LisätiedotAltistusaika 1 kk 2 kk 3 kk 1.35 1.53 1.38 1.35 1.63 1.51 1.60 1.40 2.18 1.77 1.66 1.98 1.73 1.76 1.60 1.72
Mat-.03 Koesuunnittelu ja tilastolliset mallit Mat-.03 Koesuunnittelu ja tilastolliset mallit / Ratkaisut iheet: vainsanat: Kaksisuuntainen varianssianalsi Lohkoasetelmat Latinalaiset neliöt ritmeettinen
Lisätiedot54. Tehdään yhden selittäjän lineaarinen regressioanalyysi, kun selittäjänä on määrällinen muuttuja (ja selitettävä myös):
Tilastollinen tietojenkäsittely / SPSS Harjoitus 5 Tarkastellaan ensin aineistoa KUNNAT. Kyseessähän on siis kokonaistutkimusaineisto, joten tilastollisia testejä ja niiden merkitsevyystarkasteluja ei
LisätiedotSisällysluettelo 6 REGRESSIOANALYYSI. Metsämuuronen: Monimuuttujamenetelmien perusteet SPSS-ympäristössä ALKUSANAT... 4 ALKUSANAT E-KIRJA VERSIOON...
Sisällysluettelo ALKUSANAT... 4 ALKUSANAT E-KIRJA VERSIOON...5 SISÄLLYSLUETTELO... 6 LYHYT SANASTO VASTA-ALKAJILLE... 7 1. MONIMUUTTUJAMENETELMÄT IHMISTIETEISSÄ... 9 1.1 MONIMUUTTUJA-AINEISTON ERITYISPIIRTEITÄ...
LisätiedotKemometriasta. Matti Hotokka Fysikaalisen kemian laitos Åbo Akademi Http://www.abo.fi/~mhotokka
Kemometriasta Matti Hotokka Fysikaalisen kemian laitos Åbo Akademi Http://www.abo.fi/~mhotokka Mistä puhutaan? Määritelmiä Määritys, rinnakkaismääritys Mittaustuloksen luotettavuus Kalibrointi Mittausten
LisätiedotHarjoitus 9: Excel - Tilastollinen analyysi
Harjoitus 9: Excel - Tilastollinen analyysi Mat-2.2107 Sovelletun matematiikan tietokonetyöt Syksy 2006 Mat-2.2107 Sovelletun matematiikan tietokonetyöt 1 Harjoituksen aiheita Tutustuminen regressioanalyysiin
LisätiedotSimuloinnin strategisia kysymyksiä
Simuloinnin strategisia kysymyksiä Timo Tiihonen Tietotekniikan laitos 2010 Simuloinnin strategisia kysymyksiä Miten toimitaan, kun halutaan tietää enemmän kuin yhden simulointimallin tulos. Miten tulos
LisätiedotMat Tilastollisen analyysin perusteet. Painotettu PNS-menetelmä. Avainsanat:
Mat-2.104 Tilastollisen analyysin perusteet / Ratkaisut Aiheet: Avainsanat: Mallin valinta Painotettu PNS-menetelmä Alaspäin askellus, Askellus, Askeltava valikointi, Diagnostinen grafiikka, Diagnostiset
LisätiedotMS-A0204 Differentiaali- ja integraalilaskenta 2 (ELEC2) Luento 7: Pienimmän neliösumman menetelmä ja Newtonin menetelmä.
MS-A0204 Differentiaali- ja integraalilaskenta 2 (ELEC2) Luento 7: Pienimmän neliösumman menetelmä ja Newtonin menetelmä. Antti Rasila Matematiikan ja systeemianalyysin laitos Aalto-yliopisto Kevät 2016
LisätiedotOpiskelija viipymisaika pistemäärä
806109 TILASTOTIETEEN PERUSMENETELMÄT I Harjoitus 7, viikko 9, kevät 2012 (Muut kuin taloustieteiden tiedekunnan opiskelijat) MUISTA MIKROLUOKKAHARJOITUKSET VIIKOILLA 8 JA 9! 1. Jatkoa harjoituksen 5 tehtävään
Lisätiedot1. USEAN SELITTÄJÄN LINEAARINEN REGRESSIOMALLI JA OSITTAISKORRELAATIO
Mat-2.104 Tilastollisen analyysin perusteet / Ratkaisut Aiheet: Avainsanat Usean selittäjän lineaarinen regressiomalli Estimaatti, Estimaattori, Estimointi, Jäännösneliösumma, Jäännöstermi, Jäännösvarianssi,
LisätiedotViherseinien efekti Tilastoanalyysi
Viherseinien efekti Tilastoanalyysi Risto Heikkinen Tutkimuskysymykset Seinän vaikutus koettuun haittoihin työympäristössä? Seinän vaikutus oireiden määrään? Mitkä tekijät selittävät viherseinän jatkokäytön
LisätiedotDynaamiset regressiomallit
MS-C2128 Ennustaminen ja Aikasarja-analyysi, Lauri Viitasaari Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2016 Tilastolliset aikasarjat voidaan jakaa kahteen
LisätiedotYhden selittäjän lineaarinen regressiomalli (jatkoa) Ensi viikolla ei pidetä luentoa eikä harjoituksia. Heliövaara 1
Yhden selittäjän lineaarinen regressiomalli (jatkoa) Ensi viikolla ei pidetä luentoa eikä harjoituksia Heliövaara 1 Regressiokertoimien PNS-estimaattorit Määritellään havaintojen x j ja y j, j = 1, 2,...,n
Lisätiedot1. KAKSISUUNTAINEN VARIANSSIANALYYSI: TULOSTEN TULKINTA
Mat-2.104 Tilastollisen analyysin perusteet / Ratkaisut Aiheet: Avainsanat: Kaksisuuntainen varianssianalyysi Bonferronin menetelmä, F-testi, Jäännösneliösumma, Kaksisuuntainen varianssianalyysi Kokonaiskeskiarvo,
Lisätiedot, Määrälliset tutkimusmenetelmät 2 4 op
6206209, Määrälliset tutkimusmenetelmät 2 4 op Jyrki Reunamo, Helsingin yliopisto, Opettajankoulutuslaitos 19.2.2015 1 Varianssianalyysi (Pallant 2007, Tähtinen & Isoaho 2001) Verrataan ryhmien keskiarvoja.
LisätiedotABHELSINKI UNIVERSITY OF TECHNOLOGY
Johdatus regressioanalyysiin Regressioanalyysin idea Oletetaan, että haluamme selittää jonkin selitettävän muuttujan havaittujen arvojen vaihtelun selittävien muuttujien havaittujen arvojen vaihtelun avulla.
LisätiedotTilastollisen analyysin perusteet Luento 7: Lineaarinen regressio
Tilastollisen analyysin perusteet Luento 7: Lineaarinen regressio Sisältö Regressioanalyysissä tavoitteena on tutkia yhden tai useamman selittävän muuttujan vaikutusta selitettävään muuttujaan. Sen avulla
LisätiedotKvantitatiiviset menetelmät
Kvantitatiiviset menetelmät HUOM! Tentti pidetään tiistaina.. klo 6-8 V ls. Uusintamahdollisuus on rästitentissä.. ke 6 PR sali. Siihen tulee ilmoittautua WebOodissa 9. 8.. välisenä aikana. Soveltuvan
LisätiedotHarha mallin arvioinnissa
Esitelmä 12 Antti Toppila sivu 1/18 Optimointiopin seminaari Syksy 2010 Harha mallin arvioinnissa Antti Toppila 13.10.2010 Esitelmä 12 Antti Toppila sivu 2/18 Optimointiopin seminaari Syksy 2010 Sisältö
LisätiedotMat Tilastollisen analyysin perusteet, kevät 2007
Mat-.104 Tilastollisen analyysin perusteet, kevät 007 8. luento: Usean selittäjän lineaarinen regressiomalli Kai Virtanen 1 Usean selittäjän lineaarinen regressiomalli Selitettävän muuttujan havaittujen
LisätiedotATH-koulutus: R ja survey-kirjasto THL 16.2.2011. 16. 2. 2011 ATH-koulutus / Tommi Härkänen 1
ATH-koulutus: R ja survey-kirjasto THL 16.2.2011 16. 2. 2011 ATH-koulutus / Tommi Härkänen 1 Sisältö Otanta-asetelman kuvaaminen R:llä ja survey-kirjastolla Perustunnusluvut Regressioanalyysit 16. 2. 2011
LisätiedotLumipallo regressioanalyysista. Logistinen regressioanalyysi. Soveltuvan menetelmän valinta. Regressioanalyysi. Logistinen regressioanalyysi I
Lumipallo regressioanalyysista jokainen kirjoittaa lapulle yhden lauseen regressioanalyysista ja antaa sen seuraavalle Logistinen regressioanalyysi Y250. Kvantitatiiviset menetelmät (6 op) Hanna Wass tutkijatohtori
LisätiedotHarjoitukset 4 : Paneelidata (Palautus )
31C99904, Capstone: Ekonometria ja data-analyysi TA : markku.siikanen(a)aalto.fi & tuuli.vanhapelto(a)aalto.fi Harjoitukset 4 : Paneelidata (Palautus 7.3.2017) Tämän harjoituskerran tarkoitus on perehtyä
LisätiedotJohdatus regressioanalyysiin. Heliövaara 1
Johdatus regressioanalyysiin Heliövaara 1 Regressioanalyysin idea Oletetaan, että haluamme selittää jonkin selitettävän muuttujan havaittujen arvojen vaihtelun selittävien muuttujien havaittujen arvojen
Lisätiedot805324A (805679S) Aikasarja-analyysi Harjoitus 4 (2016)
805324A (805679S) Aikasarja-analyysi Harjoitus 4 (2016) Tavoitteet (teoria): Hallita autokovarianssifunktion ominaisuuksien tarkastelu. Osata laskea autokovarianssifunktion spektriiheysfunktio. Tavoitteet
LisätiedotHarjoitukset 3 : Monimuuttujaregressio 2 (Palautus )
31C99904, Capstone: Ekonometria ja data-analyysi TA : markku.siikanen(a)aalto.fi & tuuli.vanhapelto(a)aalto.fi Harjoitukset 3 : Monimuuttujaregressio 2 (Palautus 7.2.2017) Tämän harjoituskerran tehtävät
Lisätiedotpitkittäisaineistoissa
Puuttuvan tiedon käsittelystä p. 1/18 Puuttuvan tiedon käsittelystä pitkittäisaineistoissa Tapio Nummi tan@uta.fi Matematiikan, tilastotieteen ja filosofian laitos Tampereen yliopisto Puuttuvan tiedon
LisätiedotSimuloinnin strategisia kysymyksiä
Simuloinnin strategisia kysymyksiä Miten toimitaan, kun halutaan tietää enemmän kuin yhden simulointimallin tulos. Miten tulos riippuu mallin syöttötiedoista. Miten tulos riippuu mallin rakenteellisista
Lisätiedotpitkittäisaineistoissa
Puuttuvan tiedon ongelma p. 1/18 Puuttuvan tiedon ongelma pitkittäisaineistoissa Tapio Nummi tan@uta.fi Matematiikan, tilastotieteen ja filosofian laitos Tampereen yliopisto mtl.uta.fi/tilasto/sekamallit/puupitkit.pdf
LisätiedotTilastollisten menetelmien käyttö Kelan tutkimustoiminnassa
Tilastollisten menetelmien käyttö Kelan tutkimustoiminnassa Risto Lehtonen Helsingin yliopisto Kela 1 Tilastokeskuksen SAS-seminaari 16.11.2009 Aiheita Kelan tutkimustoiminta SAS-sovellukset vaativien
LisätiedotTeema 10: Regressio- ja varianssianalyysi
Teema 1: Regressio- ja varianssianalyysi Regressioanalyysi lienee t-testin ohella maailman eniten käytetty tilastollinen menetelmä. Sitä sivuttiin jo alustavasti Teemassa 4. Varianssianalyysi liittyy useallakin
LisätiedotMonitasomallit koulututkimuksessa
Metodifestivaali 9.5.009 Monitasomallit koulututkimuksessa Mitä ihmettä? Antero Malin Koulutuksen tutkimuslaitos Jyväskylän yliopisto 009 1 Tilastollisten analyysien lähtökohta: Perusjoukolla on luonnollinen
Lisätiedot2 2 -faktorikokeen määritelmä
TKK (c) Ilkka Mellin (005) Koesuunnittelu TKK (c) Ilkka Mellin (005) : Mitä opimme? Tarkastelemme tässä luvussa seuraavaa kysymystä: Miten varianssianalyysissa tutkitaan kahden tai useamman tekijän vaikutusta
LisätiedotSEM1, työpaja 2 (12.10.2011)
SEM1, työpaja 2 (12.10.2011) Rakenneyhtälömallitus Mplus-ohjelmalla POLKUMALLIT Tarvittavat tiedostot voit ladata osoitteesta: http://users.utu.fi/eerlaa/mplus Esimerkki: Planned behavior Ajzen, I. (1985):
Lisätiedot