4. Satunnaistetut lohkokokeet, latinalaiset neliöt ja vastaavat asetelmat. Kiusatekijä on taustatekijä, joka voi vaikuttaa

Koko: px
Aloita esitys sivulta:

Download "4. Satunnaistetut lohkokokeet, latinalaiset neliöt ja vastaavat asetelmat. Kiusatekijä on taustatekijä, joka voi vaikuttaa"

Transkriptio

1 4. Satunnaistetut lohkokokeet, latinalaiset neliöt ja vastaavat asetelmat 4.1 Satunnaistettu lohkokoe (Randomized Block Design) Kiusatekijä (nuisance factor): Kiusatekijä on taustatekijä, joka voi vaikuttaa koetuloksiin, mutta siitä sinänsä ei olla kiinnostuneita. 1

2 Tavoite on eliminoida sen vaikutus koetuloksista. Eliminointimenetelmiä: Satunnaistaminen: Jos kiusatekijä ei ole havaittavissa, pyritään sen vaikutus poistamaan satunnaistamisella (randomization). Kovarianssianalyysi: Havaittavissa oleva kiusatekijä voidaan huomioida koetuloksissa kovariaatteina (lisämuuttujina). 2

3 Satunnaistettu täysi lohkokoe: [Randomized complete block design (RCBD)] Kiusatekijä on tunnistettavissa ja kontrolloitavissa. Kiusatekijän vaikutus eliminoidaan täydellä lohkokokeella, mikä tarkoittaa, että tehdään jokaiselle koeyksikölle (jokaisessa lohkossa) kaikki käsittelyt. Tyypillisesti tällainen tilanne on, kun tiedetään, että koeyksiköiden ominaispiirteet vaikuttavat koetuloksiin. Koeyksiköt (havaintoyksiöt) eivät ole homogeenisia. 3

4 Esimerkki 4.1: (ks. Esim 2.4) Halutaan tutkia antavatko metallin kovuuden tutkimisessa käytettävät neljä pistokärkeä samoja kovuustuloksia. Kullakin kärjellä halutaan tehdä neljä mittausta, eli yhteensä 5 4 = 16 mittausta. Kysymyksessä on yhden tekijän koeasetelma (tekijänä pistokärki). Jos toteutetaan täysin satuunnaistettu yhden faktorin koe, valitaan 16 testipalaa ja arvotaan kullekin pistokärjelle neljä palaa. Ongelmana kuitenkin on, että jos metallipalat ovat kovuuksiltaan erilaisia, vaikuttaa mittaustuloksiin pistokärjen ja satunnaisvirheen lisäksi myös metallipalan mahdollisesti vaihteleva ominaiskovuus. Ominaiskovuudet muodostavat tässä potentiaalisen kiusatekijän, joka kuitenkin voidaan eliminoida satunnaistetulla täydellä lohkokoeella. Menettely: Valitaan neljä metallipalaa ja tehdään mittaus jokaisessa palassa kullakin pistokärjellä (complete block design). Kussakin koepalassa mittausjärjestys on satunnainen (randomization). 4

5 Taulukko 4.1: Satunnaistettu täysi lohkokoe kovuusmittauskokeessa. =============================================================== Mittaus- Koepala Keskikarki Yhteensa Keskiarvo hajonta Yht Karv Khaj =============================================================== 5

6 Yleisesti satunnaistetun täyden lohkokokeen asetelma on muotoa: Taulukko 4.2: Randomized Complete Block Design lohko 1 lohko 2 lohko b käsittely 1 y 11 y 12 y 1b käsittely 2 y 21 y 22. y 2b käsittely a y a1 y a2 y ab Huom. 4.1: Jokaisessa lohkossa on yksi havainto per käsittely. Huom. 4.2: Käsittelyjen järjestys jokaisen lohkon sisällä on satunnainen. Täten satunnaistaminen tapahtuu vain lohkon sisällä 6

7 Tilastollinen malli Tilastollinen malli (eräs mahdollisuus) havainnoille voidaan RCBD-asetelmassa kirjoittaa muotoon (muista, että tilastollisen mallintamisessa kysymys on siitä, että mistä havaittu vaihtelu on peräisin) (1) y ij = μ + τ i + β j + ε ij, jossa μ on yleiskeskiarvo (overall mean), τ i on käsittelyn i vaikutus (treatment effect), β j on lohkon j vaikutus (block effect) ja satunnaisvirhe ε ij N(0, σ 2 ), i = 1,..., a, j = 1,..., b. Parametrit τ i ja β j ajatellaan poikkeamina keskiarvosta μ, jolloin (2) a i=1 τ i = b j=1 β j = 0. 7

8 Mallia (1) sanotaan vaikutusten esitysmuodoksi (vaikutusten malli tai efektien malli) (effects model) Vaihtoehtoisesti voidaan kirjoittaa odotusarvoesitys (mean model) (3) y ij = μ ij + ε ij, jossa μ ij = μ + τ i + β j. Jatkossa käytetään pääsääntöisesti efektien mallin esitystä. 8

9 Hypoteesit: Kysymys: Onko käsittelyillä vaikutusta? Testattavat hypotsseit: (4) H 0 : τ 1 = = τ a = 0 H 1 : τ i = 0 jollakin i Kokonaisvaihtelua mittaava neliösumma voidaan dekomponoida vaihtelun lähteiden mukaisesti (5) a i=1 b j=1 (y ij y.. ) 2 = b a i=1 ( y i. y.. ) 2 +a b j=1 ( y.j y.. ) 2 + a i=1 b j=1 (y ij y.j y i. + y.. ) 2 eli (6) SS tot = SS treat + SS block + SS err, 9

10 jossa (7) SS tot = a b i=1 j=1 (y ij y.. ) 2 on kokonaisneliösumma, (8) SS treat = b a i=1 ( y i. y.. ) 2 on käsittelyjen osuus SS tot :sta, (9) SS block = b b j=1 ( y.j y.. ) 2 on lohkojen välisen vaihtelun osuus SS tot :sta ja (10) SS err = a b i=1 j=1 (y ij y i. y.j + y.. ) 2 on virhevaihtelun osuus kokonaisvaihtelusta. 10

11 Edellä (11) y i. = 1 b (12) y.j = 1 a ja b y ij j=1 a y ij i=1 (13) y.. = 1 ab a b i=1 j=1 y ij. 11

12 Vapausasteet: SS tot : N 1, jossa df tot = N = ab, SS treat : df treat = a 1, SS block : df block = b 1 ja SS err : df err = ab (a 1) (b 1) = (a 1)(b 1) Keskineliöt: Jakamalla neliösummat vapausasteillaan saadaan keskineliösummat, joita voidaan käyttää samalla varianssien estimaattoreina. (14) MS treat = SS treat a 1, (15) MS block = SS block b 1, (16) MS err = SS err (a 1)(b 1). 12

13 Testisuure: Hypoteesin (4) testaus perustuu testisuureeseen (17) F = MS treat MS err, joka on F -jakautunut vapausasteilla a 1 ja (a 1)(b 1), jos H 0 on tosi. 13

14 Varianssitaulu: Vaihtelun Neliö- Vapaus- Keskilähde summa asteet neliöt F MS Käsittely SS treat a 1 MS treat treat MS err Lohkot SS block b 1 MS block Virhe SS err (a 1)(b 1) MS err Yhteensä SS tot N 1 Periaatteessa testisuuretta F block = MS block /MS err voidaan käyttää myös lohkovaikutusten testaamiseen (H 0 : β 1 = = β b = 0). Kuitenkin satunnaistaminen on tehty vain lohkojen sisällä, minkä seurauksena testi ei ole täysin validi. Käytännön ratkaisuna on, että käytetään sitä deskriptiivisenä suureena; jos F block on suuri on syytä lohkominen tehdä myös vastaavissa kokeissa myöhemminkin. 14

15 Esimerkki 4.2: Metallin kovuustestiaineisto. Alla olevassa kuviossa havainnot on koepaloittain (Test coupon). Hardness Testing Experiment Type of Tip Test Coupon Tip 1 Tip 2 Tip 3 Tip 4 Kuvion perusteella on ilmeistä, että koepalat ovat eri kovuisia, joten vaikutus on syytä eliminoida ennen kärkien mittaustuloksien analyysissa. 15

16 SAS-ajojono RCBD:lle: options ls = 78; /* Data from Montgomery 5 ed, p. 127 */ data hardness; input tip coupon datalines; ; proc anova data = hardness; class tip coupon; model y = tip coupon; run; 16

17 Tulokset: The ANOVA Procedure Class Level Information Class Levels Values tip coupon Number of observations 16 Dependent Variable: y Sum of Source DF Squares Mean Square F Value Pr > F Model <.0001 Error Corrected Total R-Square Coeff Var Root MSE y Mean Source DF Anova SS Mean Square F Value Pr > F tip coupon <.000 Ensimmäisessä taulukossa on yhditetty testaus, jossa on käsittelyn ja lohkon vaikutus yhdessä. Alemmassa taulukossa käsittelyn ja lohkon vaikutukset ovat erikseen. Kaikki p-arvo ovat < 0.001, joten kärjet antavat erilaisia tuloksia. Samoin lohkovaikutuksella on merkitystä, joten se on syytä huomioida. 17

18 Itse asiassa, jos lohkovaikutusta ei huomioitaisi ja analyysi olisi tehty tavanomaisena yhden faktorin kokeena, olisi tulokset seuraavanlaisia: Sum of Source DF Squares Mean Square F Value Pr > F Model Error Corrected Total Näiden tulosten mukaan mittauskärkein antamilla tuloksilla ei olisi eroa, mikä olisi mitä ilmeisemmin virheellinen johtopäätös! 18

19 Keskiarvojen yksittäiset vertailut voidaan tehdä samalla tavalla kuin yhden faktorin kokeessa. Esimerkki 4.3: Tarkastellaan esimerkkinä LSD ja Tukey vertailuja (proc anova käsky means tip / lsd tukey;) The ANOVA Procedure t Tests (LSD) for y NOTE: This test controls the Type I comparisonwise error rate, not the experimentwise error rate. Alpha 0.05 Error Degrees of Freedom 9 Error Mean Square Critical Value of t Least Significant Difference Means with the same letter are not significantly different. t Grouping Mean N tip A B B B B B

20 Tukey s Studentized Range (HSD) Test for y NOTE: This test controls the Type I experimentwise error rate, but it generally has a higher Type II error rate than REGWQ. Alpha 0.05 Error Degrees of Freedom 9 Error Mean Square Critical Value of Studentized Range Minimum Significant Difference Means with the same letter are not significantly different. Tukey Grouping Mean N tip A B B B B B Havaitaan, että eron aiheutta mittauskärki 4. 20

21 Mallin riittävyystarkastelut Residuaalit (18) ˆe ij = y ij ˆy ij = y ij (ˆμ + ˆτ i + ˆβ j ) = y ij y i. y.j + y.. jossa ˆμ = y.., ˆτ i = y i. y.. ja ˆβ j = y.j y... Näihin perustuen normaalisuus ja vakiovarianssisuus tarkastelut tehdään kuten kappaleessa 3. Huom 4.3: Havainnon y ij ennustearvo (19) ˆy ij = ˆμ + ˆτ i + ˆβ j = y.. + ( y i. y.. ) + ( y.j y.. ) = y i. + y.j y.. 21

22 Residual normal probability plot and Residuals versus predicted values Residual plots against coupon and tip No obvious non-normalities or non-linearities. 22

23 4.2 Latinalaiset neliöt Latinalaisten neliöiden koeasetelmalla voidaan eliminoida kahden kiusatekijän vaikutus koetuloksista (havainnot ovat kahden taustatekijän suhteen mahdollisesti epähomogeenisia). Perusajatus: käytetään kiusafaktoreita (nuisance factors) lohkomuuttujina (blocking variables). 23

24 Asetelma: (a) Käsittelyn (treatment) tasoja p ( 3). Molemmilla kiusafaktoreilla myös p luokkaa. (b) Muodostetaan kiusafaktoreiden luokkien mukaisesti p p taulukko. (c) Kullakin rivillä ja kullakin sarakkeella toteutetaan jokainen käsittely (treatment) täsmälleen kerran (kokeita yhteensä p 2 ja jokaisesta käsittelytasolta saadaan p havaintoa). Huom 4.4: Koeasetelmaa, jossa kullakin käsittely (treatment) tehdään täsmälleen kerran kussakin taustatekijöiden (blocking variables) määrittämässä solussa, sanotaan ortogonaaliseksi. 24

25 Etuja: (a) Yleisesti latinalaisten neliöiden koesuunnitelmilla (latinalaiset neliöt, kreikkalais-latinalaiset neliöt, hyper-kreikkalais-latinalaiset neliöt) voidaan eliminoida useamman kiusatekijän vaikutukset (b) Tarvitaan vain suhteellisen vähän koetoistoja (Latinalaisessa neliössä p 2 ). 25

26 Rajoitteita: (a) Kiusatekijöillä täytyy olla täsmälleen yhtä monta tasoa kuin käsittelyfaktorilla (p tasoa) (b) Kiusatekijöiden välillä ei saa olla yhdysvaikutusta (interaction). Myöskään kiusatekijöiden ja käsittelyfaktorin ei saa olla yhdysvaikutuksia. 26

27 Esimerkki 4.4: Tarkastellaan suihkumoottoreille tarkoitetun viiden erilaisen polttoaineseoksen palamisominaisuuksia. Kustakin raaka-aineet-erästä saadaan valmistettua erä kutakin polttoaineseosta. Seokset on mahdollista teettää viidellä eri toimittajalla. Käsittelytekijänä (treatment) on siis seos ja taustatekijöinä (kiusafaktorit) raaka-aine-erät ja toimittajat. Koeasetelma: Valmistetaan kustakin raaka-aine-erästä jokaista seostyyppiä yksi erä siten, että kukin toimittaja valmistaa yhden erän jokaista seosta, joista kunkin muodostuu eri raaka-aine-eristä. 27

28 Merkitään seoksia (käsittelyjä) aakkosilla A, B, C, D ja E, saadaan esitys, jota sanotaan latinalaiseksi neliöksi (latinalaiseten aakkosten vuoksi) Polttoaineen palamisominaisuudet ============================================================= Raaka-aine- Toimittaja (column) era (row) A = 24 B = 20 C = 19 D = 24 E = 24 2 B = 17 C = 24 D = 30 E = 27 A = 36 3 C = 18 D = 38 E = 26 A = 27 B = 21 4 D = 26 E = 31 A = 26 B = 23 C = 22 5 E = 22 A = 30 B = 20 C = 29 D = 31 ============================================================= Tärkeää on, että raaka-aineet ja toimittajat eri seoksille tulee valittua satunnaisesti. Yllä oleva neliö on yksi perusneliöistä. Permutoimalla sarakkeita ja rivejä saadaan muut neliöt. Satunnaistaminen toteutuu siten, että valitaan kaikista mahdollisita neliöistä toteutettava satunnaisesti. 28

29 Latinalaista neliötä, jossa ensimmäinen rivi ja sarake ovat aakkosjärjestyksessä sanotaan standardineliöksi (standard Latin square). Esimerkkeja standardineliosita: ================================================================= 3x3 4x4 5x5 6x A B C A B C D A B C D E A B C D E F B C A B C D A B C D E A B C D E F A C A B C D A B C D E A B C D E F A B D A B C D E A B C D E F A B C E A B C D E F A B C D F A B C D E n of std squares total n of squares number of runs ================================================================= 29

30 Tilastollinen malli: p p latinalaisen neliön malli havainnolle on muotoa (20) y ijk = μ + α i + τ j + β k + ε ijk, i = 1,..., p (rivitekijä), j = 1,..., p (käsittely [treatment]), k = 1,..., p (saraketekijä). Esimerkki 4.5: (Jatkoa) Jos i = 2, k = 3, niin j = 4(= D) ja y 143 = 30. Virhetermille pätee E[ε ijk ] = 0 ja Var[ε ijk ] = σ 2 ε. Kuten lohkokokeessa, α i, τ j ja β k ovat poikkeamia yleiskeskiarvosta ja summautuvat nolliksi. Perusoletuksena on siis, että tekijöiden (faktoreiden) välillä ei ole yhdysvaikutusta (interaction). 30

31 Havaintojen lukumäärä: N = p 2. Varianssiahjoitelma: (21) SS tot = SS row + SS column + SS treat + SS err, jossa (22) SS tot = (y ijk y) 2, (23) SS row = p (24) SS col = p (25) SS treat = p (26) i,j,k p i=1 p k=1 p j=1 ( y i.. y) 2, ( y..k y) 2, ( y.j. y) 2, SS err = SS tot SS row SS col SS treat. 31

32 Varianssitaulu: Source of Sum of Degrees of Mean variation squares freedom square F Treatments SS treat p 1 MS treat MS treat MS err Rows SS row p 1 MS row MS row MS err Columns SS col p 1 MS col MS col MS err Error SS err (p 2)(p 1) MS err Total SS tot p 2 1 Pääasiallinen kiinnostus on käsittelyn vaikutuksessa. Huom. 4.5: Varianssihajotelma noudattaa havaitun arvon y ijk dekomponointia (27) y ijk y... = ( y i. y... ) + ( y.j. y... ) + ( y..k y... ) eli +(y ijk y i.. y.j. y..k + 2 y... ) (28) tot = row + treat + col + err. 32

33 Esimerkki 4.6: Polttoaine-esimerkki. SAS:lla toteutettuna ajovirta on seuraava: data propellant; input y batch treat $ operator; label y = "burning rate"; datalines; 24 1 A B C D E B C D E A C D E A B D E A B C E A B C D 5 ; proc anova data = propellant; class batch treat operator; model y = batch treat operator; run; 33

34 Tulokset: The SAS System The ANOVA Procedure Class Level Information Class Levels Values batch treat 5 A B C D E operator Number of Observations Read 25 Number of Observations Used 25 The ANOVA Procedure Dependent Variable: y burning rate Sum of Source DF Squares Mean Square F Value Pr > F Model Error Corrected Tot R-Square Coeff Var Root MSE y Mean Source DF Anova SS Mean Square F Value Pr > F batch treat operator

35 Ylemmässä varianssitaulun F -testi testaa onko millään tekijällä vaikutusta. Alemman varianssitaulun F -testit testaavat kunkin yksittäisen tekijän vaikutusta. Tuloksista havaitaan, että eri seoksien keskimääräiset palamistulokset poikkeavat toisistaan tilastollisesti merkitsevästi. Lisäksi eri toimittajien seoksilla on vaikutusta palamistulokseen. Sen sijaan raaka-aine-erillä ei näytä olevan vaikutusta. 35

36 Mallin (20) parametrien estimaattorit ovat (29) ˆμ = y = y... = 1 N (30) ˆα i = y i.. y..., (31) ˆτ j = y.j. y..., y ijk i,j,k (32) ˆβ k = y..k y... (33) ˆy ijk = ˆμ + ˆα i + ˆτ j + ˆβ k. 36

37 Maliin riittävyyden tarkastelut: Jos malli on riittävä, residuaalit ovat puhtaasti satunnaisvaihtelua Residuaalit: (34) e ijk = y ijk ˆy ijk = y ijk y i.. y.j. y..k + 2 y... Graafisilla tarkasteluilla saadaan yleissilmäys tilanteesta. 37

38 Esimerkki 4.6: Normal probability plot and residual versus predicted Treatment versus residual and operator versus residual Normaaliisuus on jokseenkin ok, eikä ilmeisiä epälineaarisuuksia. 38

39 4.3 Kreikkalais-latinalaiset neliöt Kolme taustatekijää (nuisance factors). Käsitellään ne lohkomuuttujina. Asetelma: (a) Käsittelytasoja ja taustamuuttujien tasoja p ( 4). (b) Lähtökohtana p p latinalainen neliö, jonka päälle määritellään toinen latinalainen neliö. Käsittelyn tasoja merkitään kreikkalaisilla kirjaimilla (tästä nimi) ja kolmannen taustatekijän tasoja latinalaisilla kirjaimilla. Sarakevaikutukset Rivi Aα Bβ Cγ Dδ 2 Bδ Aγ Dβ Cα 3 Cβ Dα Aδ Bγ 4 Dγ Cδ Bα Aβ 39

40 Huom 4.6: Kysymyksessä jälleen ns. ortogonaalinen asetelma siinä mielessä, että kullakin taustatekijän tasolla käsittely toistetaan täsmälleen kerran. Tilastollinen malli: (35) y ijkl = μ + θ i + τ j + ω k + l + ε ijkl, i, j, k, l = 1,..., p. Rivi: θ i (lohkotekijä) Sarake: l (lohkotekijä) Latinalainen aakkonen: τ j (treatment) Kreikkalainen aakkonen: ω k (lohkotekijä) 40

41 Määrittelemällä kesiarvot indeksien yli kuten edellä, saadaan estimaattorit (36) ˆμ = y... = 1 N jossa N = p 2 i,j,k,l (37) ˆθ i = y i... y..., y ijkl, (38) ˆτ j = y.j.. y..., (39) ˆω k = y..k. y..., (40) ˆl = y...l y... ja sovitearvo (fitted value) (41) ˆy ijkl = ˆμ + ˆθ i + ˆτ j + ˆω k + ˆl = y... + ( y i... y... ) + ( y.j.. y... ) +( y..k. y... ) + ( y...l y... ) 41

42 Residuaali termi: (42) e ijkl = y ijkl ˆy ijkl Varianssitaulu: Source SS df M S F Latin SS latin p 1 MS latin MS latin MS err Greek SS greek p 1 MS greek MS greek MS err Rows SS row p 1 MS row MS row MS err Columns SS rol p 1 MS rol MS rol MS err Error SS err (p 3)(p 1) MS err Total SS tot p 2 1 jossa esimerkiksi (43) SS latin = p p j=1 ( y.j.. y... ) 2 42

43 Esimerkki 4.7: Polttoaine-esimerkki. Oletetaan, että kokeet tehdään viidellä eri testimoottorilla, joiden mahdollinen vaikutus halutaan eliminoida. Identifioidaan moottorit kreeikkalaisilla aakkosilla ja oletetaan, että koe on toteutettu seuraavasti: Raaka-aine- Toimittaja (column) era (row) Aα = 24 Bγ = 20 Cε = 19 Dβ = 24 Eδ = 24 2 Bβ = 17 Cδ = 24 Dα = 30 Eγ = 27 Aε = 36 3 Cγ = 18 Dε = 38 Eβ = 26 Aδ = 27 Bα = 21 4 Dδ = 26 Eα = 31 Aγ = 26 Bε = 23 Cβ = 22 5 Eε = 22 Aβ = 30 Bδ = 20 Cα = 29 Dγ = 31 43

44 data propellant; input y batch treat $ operator assembly $; label y = "burning rate"; datalines; 24 1 A 1 alpha 17 2 B 1 beta 18 3 C 1 gamma 26 4 D 1 delta 22 5 E 1 epsilon 20 1 B 2 gamma 24 2 C 2 delta 38 3 D 2 epsilon 31 4 E 2 alpha 30 5 A 2 beta 19 1 C 3 epsilon 30 2 D 3 alpha 26 3 E 3 beta 26 4 A 3 gamma 20 5 B 3 delta 24 1 D 4 beta 27 2 E 4 gamma 27 3 A 4 delta 23 4 B 4 epsilon 29 5 C 4 alpha 24 1 E 5 delta 36 2 A 5 epsilon 21 3 B 5 alpha 22 4 C 5 beta 31 5 D 5 gamma ; proc anova data = propellant; class batch treat assembly operator; model y = batch treat assembly operator; run; 44

45 Results: The ANOVA Procedure Dependent Variable: y burning rate Sum of Source DF Squares Mean Square F Value Pr > F Model Error Corrected Tot R-Square Coeff Var Root MSE y Mean Source DF Anova SS Mean Square F Value Pr > F batch treat assembly operator Testimoottorilla (assemmpply) ei näytä olevan vaikutusta (p-arvo ). 45

46 Parittaisten (ortogonaalisten) latinalaisten asetelma, joka muodostaa kreikkalais-latinalaisen neliön, voidaan yleistää edelleen. p p hyperneliö on koeasetelma, joka muodostetaan kolmesta tai useammmasta ortogonaalinen latinalaisesta neliöstä. p 1:stä ortogonaalisesta latinalaisesta neli - ostä voidaan muodostaa asetelma, jolla periaatteessa voidaan tutkia p + 1:n tekijän vaikutusta. 46

47 4.4 Balansoitu epätäydellisen lohkokoe (Balanced Incomplete Block Design, BIBD) Kaikkia käsittelyitä (treatments) ei toteuteta jokaisessa lohkossa (epätäydellinen, incomplete). Kuitenkin kaikkia käsittelykombinaatioita pidetään yhtä tärkeinä. Tällöin koe toteutetaan site, että jokainen käsittelypari esiintyy yhtä monta kertaa (balansoitu [balanced] Lähtökohta: Olkoon käsittelyn tasoja a ja jokaisessa lohkossa voidaan toteuttaa k < a koetta. 47

48 Koeasetelma: Periaatteessa koeasetelma voidaan toteuttaa siten, että valitaan (44) b = a k ) = a! k!(a k)! lohkoa ja totetutetaan kussakin yksi k alkion (käsittelyn) kombinaatio satunnaistetussa järjestyksessä. Huom. 4.7: Usein balanssi saadaan aikaiseksi pienemmällä kuin ( a k) lohkomäärällä. Kirjallisuudesta löytyy sopivia BIBD-taulukoita pienemmille lohkomäärille. 48

49 Esimerkki 4.7: Makesivalmistaja haluaa testata asiakkailla kuutta uutuustuotetta (A, B, C, D, E, F). Asiakkaita pyydetään maistamaan tuotteita ja pisteyttämään ne skaalalla Käytännön syistä kutakin koehenkilöä pyydetään maistamaan neljää tuotetta. Kokeeseen valitaan b = 15 = ( 6 4) henkilöä (lohkot) =============================================== Koehenkilo Pistemaara (tuote) [lohko, block] [kasittely, treatment]) (A) 55 (B) 69 (C) 83 (D) 2 48 (A) 87 (D) 56 (E) 22 (F) 3 65 (B) 91 (C) 67 (E) 35 (F) 4 42 (A) 48 (B) 65 (C) 43 (E) 5 36 (A) 58 (B) 69 (D) 7 (F) 6 79 (C) 85 (D) 56 (E) 25 (F) 7 54 (A) 60 (B) 90 (C) 21 (F) 8 62 (A) 92 (C) 94 (D) 63 (E) 9 39 (B) 71 (D) 47 (E) 11 (F) (A) 59 (B) 84 (D) 51 (E) (A) 74 (C) 61 (E) 25 (F) (B) 78 (C) 78 (D) 22 (F) (A) 74 (B) 59 (E) 32 (F) (A) 74 (C) 78 (D) 34 (F) (B) 83 (C) 92 (D) 68 (E) =============================================== 49

50 Satunnausistaminen on toteutettu siten, että kullekin tuotekombinaatio on jaettu satunnaisesti koehenkilöille ja maistamisjärjestys on permutoitu satunnaiseksi kunkin koehenkilön kohdalla. 50

51 Esittämällä havaintoaineisto seuraavasti nähdään selkeämmin koeasetelma. ========================================== Brand Block Subj. A B C D E F Aver Aver = grand mean ========================================== 51

52 BIBD:n tilastolinen analysointi Kästittelyjen lukumäärä: a. Lohkojen lukumäärä: b. Kussakin lohkossa k käsittelyä (k < a). Toistoja r, eli jokainen käsittely toistuu r kertaa. Havaintoja: N = ar = bk. Kukin käsittelypari esiintyy (45) λ = lohkossa. r(k 1) a 1 Jos a = b, sanotaan koeasetelmaa symmetriseksi. 52

53 Esimerkki 4.8: Makutesti. a = 6, b = 15, k = 4, r = 10, N = 6 10 = 15 4 = 60 ja λ = 10(4 1) 6 1 = 30 5 = 6. 53

54 BIBD:n tilastollinen on samaa muotoa kuin RCBD:n (Randomized Complete Block Design), [kaava (1], eli (46) y ij = μ + τ i + β j + ε ij, jossa y ij on havainto i lohkossa j. Parametri μ on yleiskeskiarvo, τ i on käsittelyn i vaikutus, β j on lohkon j vaikutus ja ε ij on virhetermi. Jälleen a i=1 τ i = 0 ja b j=1 β j = 0. Kokonaisvaihtelu voidaan dekomponoida joko (47) SS tot = SS treat(adj) + SS block + SS err, tai (48) SS tot = SS treat + SS block(adj) + SS err. 54

55 Varianssitaulu: Source SS df MS F Treatment SS treat(adj) a 1 Block SS block(adj) b 1 Error SS err N a b + 1 Total SS tot N 1 SS treat(adj) a 1 SS block(adj) b 1 F = MS treat(adj) MS err F = MS block(adj) MS err Huom. 4.8: Yllä SS tot = SS treat(adj) + SS block(adj) + SS err, koska koeasetelma ei ole enää ortogonaalinen. 55

56 SS treat(adj) ja SS block(adj) lasketaan tavalla, jossa huomioidaan, ettei kaikkia käsittelyjä ole toteutettu jokaisessa lohkossa. SAS:n proc glm ja SPSS:n General Linear Model estimoinnissa nämä saadaan Sum of Squares Type III valinnoilla. 56

57 Teknisesti tämä tapahtuu siten, että estimoidaan ensin koko malli, jossa on molemmat efektit (treatment ja block). Estimointi tapahtuu regressiotekniikalla Saadaan neliösummahajotelma (49) SS tot = SS model.full + SS err Estimoidaan seuraavaksi malli, jossa on vain block tekijä (50) SS tot = SS model.block + SS err.block SS treat(adj) saadaan erotuksena (51) SS treat(adj) = SS model.full SS model.block 57

58 Vastaavsti SS block(adj) saadaan estimoimalla ensin treat efektin malli, josta (52) SS tot = SS model.treat + SS err.treat ja (53) SS block(adj) = SS model.full SS model.treat. 58

59 Esimerkki 4.9: Makutesti SAS-toteutus, proc glm Ensiksi luodaan data: data taste; input koehenkilo pisteet tuote label koehenkilo = "block variable"; label tuote = "treatment variable"; datalines; 1 51 A 1 55 B 1 69 C 1 83 D 2 48 A 2 87 D 2 56 E 2 22 F 3 65 B 3 91 C 3 67 E 3 35 F 4 42 A 4 48 B 4 65 C 4 43 E 5 36 A 5 58 B 5 69 D 5 7 F 6 79 C 6 85 D 6 56 E 6 25 F 7 54 A 7 60 B 7 90 C 7 21 F 8 62 A 8 92 C 8 94 D 8 63 E 9 39 B 9 71 D 9 47 E 9 11 F A B D E A C E F B C D F A B E F A C D F B C D E ; run; Toteutetaan proc glm:llä proc glm data = taste; class koehenkilo tuote; model pisteet = koehenkilo tuote / ss3; run; quit; 59

60 Tulokset: The GLM Procedure Class Level Information Class Levels Values koehenkilo tuote 6 A B C D E F Number of Observations Read 60 Number of Observations Used 60 The GLM Procedure Dependent Variable: pisteet Sum of Source DF Squares Mean Square F Value Pr > F Model <.0001 Error Corrected Total R-Square Coeff Var Root MSE pisteet Mean Source DF Type III SS Mean Square F Value Pr > F koehenkilo <.0001 tuote <

61 Koska p-arvot jäävät pieniksi on selvästi pääteltävissä, että tuotteiden keskimääräiset pistemäärät poikkeavat toisistaan, eli jotkut tuotteest maistuvat selvästi paremmilta kuin toiset. Yksittäisten keskiarvojen tarkasteluilla (monivertailutestit) saadaan selville parhaimmin maistuvat tuotteet. Koehenkilöiden välillä on myös eroa, joten tämän aiheuttaman vaihtelun huomiointi on perusteltua kokeessa. 61

62 Keskiarvo vertailut (Tukey): The GLM Procedure Tukey s Studentized Range (HSD) Test for pisteet NOTE: This test controls the Type I experimentwise error rate, but it generally has a higher Type II error rate than REGWQ. Alpha 0.05 Error Degrees of Freedom 40 Error Mean Square Critical Value of Studentized Range Minimum Significant Difference Means with the same letter are not significantly different. Tukey Grouping Mean N tuote A D A A C B B B B E C A D F 62

63 Tuotteiden D ja C makuominaisuuksissa ei ole merkittävää eroa. Samoin tuotteet B ja E ovat makuominaisuuksiltaan samanlaisia. Heikoimmin pärjää D, joka poikkeaa tilastollisesti merkitsevästi toisista. 63

Tavoite on eliminoida sen vaikutus koetuloksista. 4. Satunnaistetut lohkokokeet, latinalaiset neliöt ja vastaavat asetelmat. Eliminointimenetelmiä:

Tavoite on eliminoida sen vaikutus koetuloksista. 4. Satunnaistetut lohkokokeet, latinalaiset neliöt ja vastaavat asetelmat. Eliminointimenetelmiä: 4. Satunnaistetut lohkokokeet, latinalaiset neliöt ja vastaavat asetelmat 4.1 Satunnaistettu lohkokoe (Randomized Block Design) Kiusatekijä (nuisance factor): Kiusatekijä on taustatekijä, joka voi vaikuttaa

Lisätiedot

4. Satunnaistetut lohkokokeet, latinalaiset neliöt ja vastaavat asetelmat. Tavoite on eliminoida sen vaikutus koetuloksista. Eliminointimenetelmiä:

4. Satunnaistetut lohkokokeet, latinalaiset neliöt ja vastaavat asetelmat. Tavoite on eliminoida sen vaikutus koetuloksista. Eliminointimenetelmiä: 4. Satunnaistetut lohkokokeet, latinalaiset neliöt ja vastaavat asetelmat Tavoite on eliminoida sen vaikutus koetuloksista. 4.1 Satunnaistettu lohkokoe (Randomized Block Design) Kiusatekijä (nuisance factor):

Lisätiedot

Yhden faktorin koeasetelma, jossa faktorilla on a tasoa (kokeessa on a käsittelyä).

Yhden faktorin koeasetelma, jossa faktorilla on a tasoa (kokeessa on a käsittelyä). 3. Yhden faktorin kokeet 3.1 Varianssianalyysi Yhden faktorin koeasetelma, jossa faktorilla on a tasoa (kokeessa on a käsittelyä). Esimerkki 3.1: Tutkitaan kankaassa käytettävän synteettisen kuidun vetolujuutta,

Lisätiedot

Faktorikokeilla tarkoitetaan koesuunnitelmaa, jossa koe toistetaan kaikilla faktoreiden tasojen kombninaatioilla.

Faktorikokeilla tarkoitetaan koesuunnitelmaa, jossa koe toistetaan kaikilla faktoreiden tasojen kombninaatioilla. 5. Johdatus faktorikokeisiin 5.1 Taustaa Faktorikokeilla tarkoitetaan koesuunnitelmaa, jossa koe toistetaan kaikilla faktoreiden tasojen kombninaatioilla. Täten, jos faktorilla A on a tasoa ja faktorilla

Lisätiedot

3. Yhden faktorin kokeet. 3.1 Varianssianalyysi. Yhden faktorin koeasetelma, jossa faktorilla on a tasoa (kokeessa on a käsittelyä).

3. Yhden faktorin kokeet. 3.1 Varianssianalyysi. Yhden faktorin koeasetelma, jossa faktorilla on a tasoa (kokeessa on a käsittelyä). 3. Yhden faktorin kokeet 3.1 Varianssianalyysi Yhden faktorin koeasetelma, jossa faktorilla on a tasoa (kokeessa on a käsittelyä). Esimerkki 3.1: Tutkitaan kankaassa käytettävän synteettisen kuidun vetolujuutta,

Lisätiedot

3. Yhden faktorin kokeet. 3.1 Varianssianalyysi. Yhden faktorin koeasetelma, jossa faktorilla on a tasoa (kokeessa on a käsittelyä).

3. Yhden faktorin kokeet. 3.1 Varianssianalyysi. Yhden faktorin koeasetelma, jossa faktorilla on a tasoa (kokeessa on a käsittelyä). 3. Yhden faktorin kokeet 3.1 Varianssianalyysi Yhden faktorin koeasetelma, jossa faktorilla on a tasoa (kokeessa on a käsittelyä). Esimerkki 3.1: Tutkitaan kankaassa käytettävän synteettisen kuidun vetolujuutta,

Lisätiedot

7. Lohkominen ja sulautus 2 k kokeissa. Lohkominen (Blocking)

7. Lohkominen ja sulautus 2 k kokeissa. Lohkominen (Blocking) 7. Lohkominen ja sulautus 2 k kokeissa Lohkominen (Blocking) Lohkotekijät muodostuvat faktoreista, joiden suhteen ei voida tehdä (täydellistä) satunnaistamista. Esimerkiksi faktorikokeessa raaka-aine-erät

Lisätiedot

Kaksitasoiset hierarkiset asetelmat (Two-Stage Nested Designs) 9. Muita koeasetelmia. 9.1 Hierarkiset asetelmat (Nested Designs)

Kaksitasoiset hierarkiset asetelmat (Two-Stage Nested Designs) 9. Muita koeasetelmia. 9.1 Hierarkiset asetelmat (Nested Designs) 9. Muita koeasetelmia 9.1 Hierarkiset asetelmat (Nested Designs) Tietyissä koetilanteissa yhden faktorin tasot ovat samanlaisia joskaan ei täysin identtisiä toisen faktorin eri tasoilla. Tällaista asetelmaa

Lisätiedot

5. Johdatus faktorikokeisiin. Tekijän omaa vaikutusta vastemuuttujaan sanotaan. 5.1 Taustaa

5. Johdatus faktorikokeisiin. Tekijän omaa vaikutusta vastemuuttujaan sanotaan. 5.1 Taustaa 5. Johdatus faktorikokeisiin 5.1 Taustaa Faktorikokeilla tarkoitetaan koesuunnitelmaa, jossa koe toistetaan kaikilla faktoreiden tasojen kombninaatioilla. Täten, jos faktorilla A on a tasoa ja faktorilla

Lisätiedot

5. Johdatus faktorikokeisiin. Tekijän omaa vaikutusta vastemuuttujaan sanotaan. 5.1 Taustaa

5. Johdatus faktorikokeisiin. Tekijän omaa vaikutusta vastemuuttujaan sanotaan. 5.1 Taustaa 5. Johdatus faktorikokeisiin 5.1 Taustaa Faktorikokeilla tarkoitetaan koesuunnitelmaa, jossa koe toistetaan kaikilla faktoreiden tasojen kombninaatioilla. Täten, jos faktorilla A on a tasoa ja faktorilla

Lisätiedot

Lohkotekijät muodostuvat faktoreista, joiden suhteen ei voida tehdä (täydellistä) satunnaistamista.

Lohkotekijät muodostuvat faktoreista, joiden suhteen ei voida tehdä (täydellistä) satunnaistamista. 7. Lohkominen ja sulautus 2 k kokeissa Lohkominen (Blocking) Lohkotekijät muodostuvat faktoreista, joiden suhteen ei voida tehdä (täydellistä) satunnaistamista. Esimerkiksi faktorikokeessa raaka-aine-erät

Lisätiedot

Lohkoasetelmat. Vilkkumaa / Kuusinen 1

Lohkoasetelmat. Vilkkumaa / Kuusinen 1 Lohkoasetelmat Vilkkumaa / Kuusinen 1 Motivointi 1/3 Kaksisuuntaisella varianssianalyysilla voidaan tutkia kahden tekijän A ja B vaikutusta sekä niiden yhdysvaikutusta tutkimuksen kohteeseen Kaksisuuntaisessa

Lisätiedot

9.1 Hierarkiset asetelmat (Nested Designs)

9.1 Hierarkiset asetelmat (Nested Designs) 9. Muita koeasetelmia 9.1 Hierarkiset asetelmat (Nested Designs) Tietyissä koetilanteissa yhden faktorin tasot ovat samanlaisia joskaan ei täysin identtisiä toisen faktorin eri tasoilla. Tällaista asetelmaa

Lisätiedot

7. Lohkominen ja sulautus 2 k kokeissa. Lohkominen (Blocking)

7. Lohkominen ja sulautus 2 k kokeissa. Lohkominen (Blocking) 7. Lohkominen ja sulautus 2 k kokeissa Lohkominen (Blocking) Lohkotekijät muodostuvat faktoreista, joiden suhteen ei voida tehdä (täydellistä) satunnaistamista. Esimerkiksi faktorikokeessa raaka-aine-erät

Lisätiedot

Lohkoasetelmat. Heliövaara 1

Lohkoasetelmat. Heliövaara 1 Lohkoasetelmat Heliövaara 1 Kiusatekijä Kaikissa kokeissa, kokeen tuloksiin voi vaikuttaa vaihtelu joka johtuu kiusatekijästä. Kiusatekijä on tekijä, jolla mahdollisesti on vaikutusta vastemuuttujan arvoon,

Lisätiedot

VARIANSSIANALYYSI ANALYSIS OF VARIANCE

VARIANSSIANALYYSI ANALYSIS OF VARIANCE VARIANSSIANALYYSI ANALYSIS OF VARIANCE 1 Suomalaisten aikuisten pituusjakauma:.8.7.6.5.4.3.2.1 14 15 16 17 18 19 2 21 Jakauma ei ole normaali, sen olettaminen sellaiseksi johtaa virheellisiin päätelmiin.

Lisätiedot

Lohkoasetelmat. Kuusinen/Heliövaara 1

Lohkoasetelmat. Kuusinen/Heliövaara 1 Lohkoasetelmat Kuusinen/Heliövaara 1 Kiusatekijä Kaikissa kokeissa kokeen tuloksiin voi vaikuttaa vaihtelu, joka johtuu kiusatekijästä. Kiusatekijä on tekijä, jolla on mahdollisesti vaikutusta vastemuuttujan

Lisätiedot

9. Muita koeasetelmia. Kaksitasoiset hierarkiset asetelmat (Two-Stage Nested Designs) 9.1 Hierarkiset asetelmat (Nested Designs)

9. Muita koeasetelmia. Kaksitasoiset hierarkiset asetelmat (Two-Stage Nested Designs) 9.1 Hierarkiset asetelmat (Nested Designs) 9. Muita koeasetelmia 9.1 Hierarkiset asetelmat (Nested Designs) Tietyissä koetilanteissa yhden faktorin tasot ovat samanlaisia joskaan ei täysin identtisiä toisen faktorin eri tasoilla. Tällaista asetelmaa

Lisätiedot

Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt: Mitä opimme? Latinalaiset neliöt

Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt: Mitä opimme? Latinalaiset neliöt TKK (c) Ilkka Mellin (005) Koesuunnittelu TKK (c) Ilkka Mellin (005) : Mitä opimme? Tarkastelemme tässä luvussa seuraavaa kysymystä: Miten varianssianalyysissa tutkitaan yhden tekijän vaikutusta vastemuuttujaan,

Lisätiedot

proc glm data = ex61; Title2 "Aliasing Structure of the 2_IV^(5-1) design"; model y = A B C D E /Aliasing; run; quit;

proc glm data = ex61; Title2 Aliasing Structure of the 2_IV^(5-1) design; model y = A B C D E /Aliasing; run; quit; Title "Exercises 6"; Data ex61; input A B C D E y @@; Label A = "Furnance Temperature" B = "Heating Time" C = "Transfer Time" D = "Hold Down Time" E = "Quench of Oil Temperature" y = "Free Height of Leaf

Lisätiedot

Kaksisuuntaisen varianssianalyysin tilastollisessa malli voidaan esittää seuraavassa muodossa:

Kaksisuuntaisen varianssianalyysin tilastollisessa malli voidaan esittää seuraavassa muodossa: Mat-.03 Koesuunnittelu ja tilastolliset mallit Mat-.03 Koesuunnittelu ja tilastolliset mallit / Ratkaisut Aiheet: Avainsanat: Kaksisuuntainen varianssianalsi Aritmeettinen keskiarvo, Estimointi, F-testi,

Lisätiedot

Altistusaika 1 kk 2 kk 3 kk 1.35 1.53 1.38 1.35 1.63 1.51 1.60 1.40 2.18 1.77 1.66 1.98 1.73 1.76 1.60 1.72

Altistusaika 1 kk 2 kk 3 kk 1.35 1.53 1.38 1.35 1.63 1.51 1.60 1.40 2.18 1.77 1.66 1.98 1.73 1.76 1.60 1.72 Mat-.03 Koesuunnittelu ja tilastolliset mallit Mat-.03 Koesuunnittelu ja tilastolliset mallit / Ratkaisut iheet: vainsanat: Kaksisuuntainen varianssianalsi Lohkoasetelmat Latinalaiset neliöt ritmeettinen

Lisätiedot

A250A0050 Ekonometrian perusteet Tentti

A250A0050 Ekonometrian perusteet Tentti A250A0050 Ekonometrian perusteet Tentti 28.9.2016 Tentissä ei saa käyttää laskinta. Tentistä saa max 80 pistettä. Hyväksytysti suoritetusta harjoitustyöstä saa max 20 pistettä. Huom. Merkitse vastauspaperin

Lisätiedot

Lähtökohta: k faktoria, kullakin kaksi tasoa ("high", "low"). tulee katettua (complete replicate). Havaintojen

Lähtökohta: k faktoria, kullakin kaksi tasoa (high, low). tulee katettua (complete replicate). Havaintojen 6. 2 k faktorikokeet Lähtökohta: k faktoria, kullakin kaksi tasoa ("high", "low"). Vähintään 2 k havaintoa, jotta kaikki vaihtoehdot tulee katettua (complete replicate). Havaintojen kokonaismäärä N = 2

Lisätiedot

1. PÄÄTTELY YHDEN SELITTÄJÄN LINEAARISESTA REGRESSIOMALLISTA

1. PÄÄTTELY YHDEN SELITTÄJÄN LINEAARISESTA REGRESSIOMALLISTA Mat-2.104 Tilastollisen analyysin perusteet / Ratkaisut Aiheet: Avainsanat Päättely yhden selittäjän lineaarisesta regressiomallista Ennustaminen, Ennuste, Ennusteen luottamusväli, Estimaatti, Estimaattori,

Lisätiedot

Tässä harjoituksessa käydään läpi R-ohjelman käyttöä esimerkkidatan avulla. eli matriisissa on 200 riviä (havainnot) ja 7 saraketta (mittaus-arvot)

Tässä harjoituksessa käydään läpi R-ohjelman käyttöä esimerkkidatan avulla. eli matriisissa on 200 riviä (havainnot) ja 7 saraketta (mittaus-arvot) R-ohjelman käyttö data-analyysissä Panu Somervuo 2014 Tässä harjoituksessa käydään läpi R-ohjelman käyttöä esimerkkidatan avulla. 0) käynnistetään R-ohjelma Huom.1 allaolevissa ohjeissa '>' merkki on R:n

Lisätiedot

Perusnäkymä yksisuuntaiseen ANOVAaan

Perusnäkymä yksisuuntaiseen ANOVAaan Metsämuuronen 2006. TTP Tutkimuksen tekemisen perusteet ihmistieteissä Taulukko.51.1 Analyysiin mukaan tulevat muuttujat Mja selite Merkitys mallissa F1 Ensimmäinen faktoripistemuuttuja Selitettävä muuttuja

Lisätiedot

6. 2 k faktorikokeet. Lähtökohta: k faktoria, kullakin kaksi tasoa ("high", "low"). määrä per faktoritasokombinaatio (balansoidussa)kokeessa.

6. 2 k faktorikokeet. Lähtökohta: k faktoria, kullakin kaksi tasoa (high, low). määrä per faktoritasokombinaatio (balansoidussa)kokeessa. 6. 2 k faktorikokeet Lähtökohta: k faktoria, kullakin kaksi tasoa ("high", "low"). Vähintään 2 k havaintoa, jotta kaikki vaihtoehdot tulee katettua (complete replicate). Havaintojen kokonaismäärä N =2

Lisätiedot

OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi. Luento 3

OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi. Luento 3 OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi Luento 3 Tutkimussuunnitelman rakenne-ehdotus Otsikko 1. Motivaatio/tausta 2. Tutkimusaihe/ -tavoitteet ja kysymykset

Lisätiedot

2 k -faktorikokeet. Vilkkumaa / Kuusinen 1

2 k -faktorikokeet. Vilkkumaa / Kuusinen 1 2 k -faktorikokeet Vilkkumaa / Kuusinen 1 Motivointi 2 k -faktorikoe on k-suuntaisen varianssianalyysin erikoistapaus, jossa kaikilla tekijöillä on vain kaksi tasoa, matala (-) ja korkea (+). 2 k -faktorikoetta

Lisätiedot

Kaksisuuntainen varianssianalyysi. Heliövaara 1

Kaksisuuntainen varianssianalyysi. Heliövaara 1 Kaksisuuntainen varianssianalyysi Heliövaara 1 Kaksi- tai useampisuuntainen varianssianalyysi Kaksi- tai useampisuuntaisessa varianssianalyysissa perusjoukko on jaettu ryhmiin kahden tai useamman tekijän

Lisätiedot

xi = yi = 586 Korrelaatiokerroin r: SS xy = x i y i ( x i ) ( y i )/n = SS xx = x 2 i ( x i ) 2 /n =

xi = yi = 586 Korrelaatiokerroin r: SS xy = x i y i ( x i ) ( y i )/n = SS xx = x 2 i ( x i ) 2 /n = 1. Tutkitaan paperin ominaispainon X(kg/dm 3 ) ja puhkaisulujuuden Y (m 2 ) välistä korrelaatiota. Tiettyä laatua olevasta paperierästä on otettu satunnaisesti 10 arkkia ja määritetty jokaisesta arkista

Lisätiedot

1. KAKSISUUNTAINEN VARIANSSIANALYYSI: TULOSTEN TULKINTA

1. KAKSISUUNTAINEN VARIANSSIANALYYSI: TULOSTEN TULKINTA Mat-2.104 Tilastollisen analyysin perusteet / Ratkaisut Aiheet: Avainsanat: Kaksisuuntainen varianssianalyysi Bonferronin menetelmä, F-testi, Jäännösneliösumma, Kaksisuuntainen varianssianalyysi Kokonaiskeskiarvo,

Lisätiedot

Ongelma: Poikkeaako perusjoukon suhteellinen osuus vertailuarvosta?

Ongelma: Poikkeaako perusjoukon suhteellinen osuus vertailuarvosta? Yhden otoksen suhteellisen osuuden testaus Ongelma: Poikkeaako perusjoukon suhteellinen osuus vertailuarvosta? Hypoteesit H 0 : p = p 0 H 1 : p p 0 tai H 1 : p > p 0 tai H 1 : p < p 0 Suhteellinen osuus

Lisätiedot

Toimittaja 1 2 3 Erä 1 2 3 4 1 2 3 4 1 2 3 4 1 2 2 1 1 0 1 0 2 2 1 3 1 3 0 4 2 4 0 3 4 0 1 2 0 4 1 0 3 2 2 2 0 2 2 1

Toimittaja 1 2 3 Erä 1 2 3 4 1 2 3 4 1 2 3 4 1 2 2 1 1 0 1 0 2 2 1 3 1 3 0 4 2 4 0 3 4 0 1 2 0 4 1 0 3 2 2 2 0 2 2 1 Mat-.03 Koesuunnittelu ja tilastolliset mallit / Ratkaisut Aiheet: Avainsanat: Hierarkkiset koeasetelmat -faktorikokeet Vastepintamenetelmä Aritmeettinen keskiarvo, Estimaatti, Estimaattori, -testi, aktorikokeet,

Lisätiedot

Osafaktorikokeet. Kurssipalautetta voi antaa Oodissa Kuusinen/Heliövaara 1

Osafaktorikokeet. Kurssipalautetta voi antaa Oodissa Kuusinen/Heliövaara 1 Osafaktorikokeet Kurssipalautetta voi antaa Oodissa 27.4.-25.5. Kuusinen/Heliövaara 1 Osafaktorikokeet Kun faktorien määrä 2 k -faktorikokeessa kasvaa, tarvittavien havaintojen määrä voi ylittää kokeen

Lisätiedot

Latinalaiset neliöt ja taikaneliöt

Latinalaiset neliöt ja taikaneliöt Latinalaiset neliöt ja taikaneliöt LuK-tutkielma Aku-Petteri Niemi Matemaattisten tieteiden tutkinto-ohjelma Oulun yliopisto Kevät 2018 Sisältö Johdanto 2 1 Latinalaiset neliöt 3 1.1 Latinalainen neliö.........................

Lisätiedot

2. Keskiarvojen vartailua

2. Keskiarvojen vartailua 2. Keskiarvojen vartailua Esimerkki 2.1: Oheiset mittaukset liittyvät Portland Sementin sidoslujuuteen (kgf/cm 2 ). Mittaukset y 1 ovat nykyisestä seoksesta ja mittaukset y 2 uudesta seoksesta, jossa lisäaineena

Lisätiedot

r = 0.221 n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit.

r = 0.221 n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit. A. r = 0. n = Tilastollista testausta varten määritetään aluksi hypoteesit. H 0 : Korrelaatiokerroin on nolla. H : Korrelaatiokerroin on nollasta poikkeava. Tarkastetaan oletukset: - Kirjoittavat väittävät

Lisätiedot

Tilastollinen vastepintamallinnus: kokeiden suunnittelu, regressiomallin analyysi, ja vasteen optimointi. Esimerkit laskettu JMP:llä

Tilastollinen vastepintamallinnus: kokeiden suunnittelu, regressiomallin analyysi, ja vasteen optimointi. Esimerkit laskettu JMP:llä Tilastollinen vastepintamallinnus: kokeiden suunnittelu, regressiomallin analyysi, ja vasteen optimointi Esimerkit laskettu JMP:llä Antti Hyttinen Tampereen teknillinen yliopisto 29.12.2003 ii Ohjelmien

Lisätiedot

Tilastollisen analyysin perusteet Luento 9: Moniulotteinen lineaarinen. regressio

Tilastollisen analyysin perusteet Luento 9: Moniulotteinen lineaarinen. regressio Tilastollisen analyysin perusteet Luento 9: lineaarinen lineaarinen Sisältö lineaarinen lineaarinen lineaarinen Lineaarinen Oletetaan, että meillä on n kappaletta (x 1, y 1 ), (x 2, y 2 )..., (x n, y n

Lisätiedot

Keskipisteen lisääminen 2 k -faktorikokeeseen (ks. Montgomery 9-6)

Keskipisteen lisääminen 2 k -faktorikokeeseen (ks. Montgomery 9-6) Mat-.3 Koesuunnittelu ja tilastolliset mallit kevät Keskipisteen lisääminen k -faktorikokeeseen (ks. Montgomery 9-6) Esim (Montg. ex. 9-, 6-): Tutkitaan kemiallisen prosessin saannon Y riippuvuutta faktoreista

Lisätiedot

Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1

Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1 Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1 Odotusarvoparien vertailu Jos yksisuuntaisen varianssianalyysin nollahypoteesi H 0 : µ 1 = µ 2 = = µ k = µ hylätään tiedetään, että ainakin kaksi

Lisätiedot

MTTTP5, luento Luottamusväli, määritelmä

MTTTP5, luento Luottamusväli, määritelmä 23.11.2017/1 MTTTP5, luento 23.11.2017 Luottamusväli, määritelmä Olkoot A ja B satunnaisotoksen perusteella määriteltyjä satunnaismuuttujia. Väli (A, B) on parametrin 100(1 - ) %:n luottamusväli, jos P(A

Lisätiedot

Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1

Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1 Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1 Odotusarvoparien vertailu Jos yksisuuntaisen varianssianalyysin nollahypoteesi H 0 : µ 1 = µ 2 = = µ k = µ hylätään, tiedetään, että ainakin

Lisätiedot

Residuaalit. Residuaalit. UK Ger Fra US Austria. Maat

Residuaalit. Residuaalit. UK Ger Fra US Austria. Maat TAMPEREEN YLIOPISTO Tilastollisen mallintamisen harjoitustyö Teemu Kivioja ja Mika Helminen Epätasapainoisen koeasetelman analyysi Worksheet 5 Matematiikan, tilastotieteen ja filosofian laitos Tilastotiede

Lisätiedot

Kaksisuuntainen varianssianalyysi. Vilkkumaa / Kuusinen 1

Kaksisuuntainen varianssianalyysi. Vilkkumaa / Kuusinen 1 Kaksisuuntainen varianssianalyysi Vilkkumaa / Kuusinen 1 Motivointi Luennot 6 ja 7: yksisuuntaisella varianssianalyysilla testataan ryhmäkohtaisten odotusarvojen yhtäsuuruutta, kun perusjoukko on jaettu

Lisätiedot

Osafaktorikokeet. Heliövaara 1

Osafaktorikokeet. Heliövaara 1 Osafaktorikokeet Heliövaara 1 Osafaktorikokeet Kun faktorien määrä 2 k -faktorikokeessa kasvaa, tarvittavien havaintojen määrä voi ylittää kokeentekijän resurssit. Myös estimoitavien korkean asteen yhdysvaikutustermien

Lisätiedot

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

Tilastollinen testaus. Vilkkumaa / Kuusinen 1 Tilastollinen testaus Vilkkumaa / Kuusinen 1 Motivointi Viime luennolla: havainnot generoineen jakauman muoto on usein tunnettu, mutta parametrit tulee estimoida Joskus parametreista on perusteltua esittää

Lisätiedot

Odotusarvoparien vertailu. Vilkkumaa / Kuusinen 1

Odotusarvoparien vertailu. Vilkkumaa / Kuusinen 1 Odotusarvoparien vertailu Vilkkumaa / Kuusinen 1 Motivointi Viime luennolta: yksisuuntaisella varianssianalyysilla testataan nollahypoteesia H 0 : μ 1 = μ 2 = = μ k = μ Jos H 0 hylätään, tiedetään, että

Lisätiedot

Testejä suhdeasteikollisille muuttujille

Testejä suhdeasteikollisille muuttujille Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Testejä suhdeasteikollisille muuttujille TKK (c) Ilkka Mellin (007) 1 Testejä suhdeasteikollisille muuttujille >> Testit normaalijakauman

Lisätiedot

6. 2 k faktorikokeet. Lähtökohta: k faktoria, kullakin kaksi tasoa ("high", "low"). määrä per faktoritasokombinaatio (balansoidussa)kokeessa.

6. 2 k faktorikokeet. Lähtökohta: k faktoria, kullakin kaksi tasoa (high, low). määrä per faktoritasokombinaatio (balansoidussa)kokeessa. 6. 2 k faktorikokeet Lähtökohta: k faktoria, kullakin kaksi tasoa ("high", "low"). Vähintään 2 k havaintoa, jotta kaikki vaihtoehdot tulee katettua (complete replicate). Havaintojen kokonaismäärä N =2

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 8. marraskuuta 2007 Antti Rasila () TodB 8. marraskuuta 2007 1 / 15 1 Tilastollisia testejä Z-testi Normaalijakauman odotusarvon testaus, keskihajonta tunnetaan

Lisätiedot

1. YKSISUUNTAINEN VARIANSSIANALYYSI: AINEISTON ESITYSMUODOT

1. YKSISUUNTAINEN VARIANSSIANALYYSI: AINEISTON ESITYSMUODOT Mat-2.104 Tilastollisen analyysin perusteet / Ratkaisut Aiheet: Avainsanat: Yksisuuntainen varianssianalyysi Bartlettin testi, Bonferronin menetelmä, F-testi, Jäännösneliösumma, χ 2 -testi, Kokonaiskeskiarvo,

Lisätiedot

54. Tehdään yhden selittäjän lineaarinen regressioanalyysi, kun selittäjänä on määrällinen muuttuja (ja selitettävä myös):

54. Tehdään yhden selittäjän lineaarinen regressioanalyysi, kun selittäjänä on määrällinen muuttuja (ja selitettävä myös): Tilastollinen tietojenkäsittely / SPSS Harjoitus 5 Tarkastellaan ensin aineistoa KUNNAT. Kyseessähän on siis kokonaistutkimusaineisto, joten tilastollisia testejä ja niiden merkitsevyystarkasteluja ei

Lisätiedot

Regressioanalyysi. Vilkkumaa / Kuusinen 1

Regressioanalyysi. Vilkkumaa / Kuusinen 1 Regressioanalyysi Vilkkumaa / Kuusinen 1 Regressioanalyysin idea ja tavoitteet Regressioanalyysin idea: Halutaan selittää selitettävän muuttujan havaittujen arvojen vaihtelua selittävien muuttujien havaittujen

Lisätiedot

[MTTTA] TILASTOMENETELMIEN PERUSTEET, KEVÄT 209 https://coursepages.uta.fi/mttta/kevat-209/ HARJOITUS 5 viikko 8 RYHMÄT: ke 2.5 3.45 ls. C6 Leppälä to 08.30 0.00 ls. C6 Korhonen to 2.5 3.45 ls. C6 Korhonen

Lisätiedot

8. Osittaiset 2 k faktorikokeet. Niinpä, jos voidaan olettaa, että korekeamman

8. Osittaiset 2 k faktorikokeet. Niinpä, jos voidaan olettaa, että korekeamman 8. Osittaiset 2 k faktorikokeet Faktoreiden lukumäärän k kasvaessa 2 k koeasetelmassa kasvaa koetoistojen (runs) määrää nopeasti täydessä toteutuksessa (complete replicate). Esimerkiksi 2 6 asetelman täysi

Lisätiedot

Johdatus varianssianalyysiin. Vilkkumaa / Kuusinen 1

Johdatus varianssianalyysiin. Vilkkumaa / Kuusinen 1 Johdatus varianssianalyysiin Vilkkumaa / Kuusinen 1 Motivointi Luento 4: kahden riippumattoman otoksen odotusarvoja voidaan vertailla t-testillä H 0 : μ 1 = μ 2, T = ˉX 1 ˉX 2 s 2 1 + s2 2 n 1 n 2 a t(min[(n

Lisätiedot

Regressioanalyysi. Kuusinen/Heliövaara 1

Regressioanalyysi. Kuusinen/Heliövaara 1 Regressioanalyysi Kuusinen/Heliövaara 1 Regressioanalyysin idea ja tavoitteet Regressioanalyysin idea: Oletetaan, että haluamme selittää jonkin selitettävän muuttujan havaittujen arvojen vaihtelun joidenkin

Lisätiedot

Vastepintamenetelmä. Kuusinen/Heliövaara 1

Vastepintamenetelmä. Kuusinen/Heliövaara 1 Vastepintamenetelmä Kuusinen/Heliövaara 1 Vastepintamenetelmä Vastepintamenetelmässä pyritään vasteen riippuvuutta siihen vaikuttavista tekijöistä approksimoimaan tekijöiden polynomimuotoisella funktiolla,

Lisätiedot

voidaan hylätä, pienempi vai suurempi kuin 1 %?

voidaan hylätä, pienempi vai suurempi kuin 1 %? [TILTP1] TILASTOTIETEEN JOHDANTOKURSSI, Syksy 2011 http://www.uta.fi/~strale/tiltp1/index.html 30.9.2011 klo 13:07:54 HARJOITUS 5 viikko 41 Ryhmät ke 08.30 10.00 ls. C8 Leppälä to 12.15 13.45 ls. A2a Laine

Lisätiedot

Hierarkkiset koeasetelmat. Heliövaara 1

Hierarkkiset koeasetelmat. Heliövaara 1 Hierarkkiset koeasetelmat Heliövaara 1 Hierarkkiset koeasetelmat Kaksiasteista hierarkkista koeasetelmaa käytetään tarkasteltaessa seuraavaa kysymystä: Miten varianssianalyysissa tutkitaan kahden tekijän

Lisätiedot

Väliestimointi (jatkoa) Heliövaara 1

Väliestimointi (jatkoa) Heliövaara 1 Väliestimointi (jatkoa) Heliövaara 1 Bernoulli-jakauman odotusarvon luottamusväli 1/2 Olkoon havainnot X 1,..., X n yksinkertainen satunnaisotos Bernoulli-jakaumasta parametrilla p. Eli X Bernoulli(p).

Lisätiedot

Harjoitus 9: Excel - Tilastollinen analyysi

Harjoitus 9: Excel - Tilastollinen analyysi Harjoitus 9: Excel - Tilastollinen analyysi Mat-2.2107 Sovelletun matematiikan tietokonetyöt Syksy 2006 Mat-2.2107 Sovelletun matematiikan tietokonetyöt 1 Harjoituksen aiheita Tutustuminen regressioanalyysiin

Lisätiedot

Koesuunnittelu 2 k -faktorikokeet. TKK (c) Ilkka Mellin (2005) 1

Koesuunnittelu 2 k -faktorikokeet. TKK (c) Ilkka Mellin (2005) 1 Koesuunnittelu 2 k -faktorikokeet TKK (c) Ilkka Mellin (2005) 2 k -faktorikokeet 2 2 -faktorikokeet 2 3 -faktorikokeet 2 k -faktorikokeet TKK (c) Ilkka Mellin (2005) 2 2 k -faktorikokeet: Mitä opimme?

Lisätiedot

Esim Brand lkm keskiarvo keskihajonta A ,28 5,977 B ,06 3,866 C ,95 4,501

Esim Brand lkm keskiarvo keskihajonta A ,28 5,977 B ,06 3,866 C ,95 4,501 Esim. 2.1.1. Brand lkm keskiarvo keskihajonta A 10 251,28 5,977 B 10 261,06 3,866 C 10 269,95 4,501 y = 260, 76, n = 30 SS 1 = (n 1 1)s 2 1 = (10 1)5, 977 2 321, 52 SS 2 = (n 2 1)s 2 2 = (10 1)3, 8662

Lisätiedot

(d) Laske selittäjään paino liittyvälle regressiokertoimelle 95 %:n luottamusväli ja tulkitse tulos lyhyesti.

(d) Laske selittäjään paino liittyvälle regressiokertoimelle 95 %:n luottamusväli ja tulkitse tulos lyhyesti. 2. VÄLIKOE vuodelta -14 1. Liitteessä 1 on esitetty R-ohjelmalla saatuja tuloksia aineistosta, johon on talletettu kahdenkymmenen satunnaisesti valitun miehen paino (kg), vyötärön ympärysmitta (cm) ja

Lisätiedot

Mat Tilastollisen analyysin perusteet, kevät 2007

Mat Tilastollisen analyysin perusteet, kevät 2007 Mat-2.2104 Tilastollisen analyysin perusteet, kevät 2007 2. luento: Tilastolliset testit Kai Virtanen 1 Tilastollinen testaus Tutkimuksen kohteena olevasta perusjoukosta esitetään väitteitä oletuksia joita

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 22. marraskuuta 2007 Antti Rasila () TodB 22. marraskuuta 2007 1 / 17 1 Epäparametrisia testejä (jatkoa) χ 2 -riippumattomuustesti 2 Johdatus regressioanalyysiin

Lisätiedot

Koesuunnittelu Latinalaiset neliöt. TKK (c) Ilkka Mellin (2005) 1

Koesuunnittelu Latinalaiset neliöt. TKK (c) Ilkka Mellin (2005) 1 Koesuunnittelu Latinalaiset neliöt TKK (c) Ilkka Mellin (2005) 1 Latinalaiset neliöt Latinalaisten neliöiden koeasetelma ja sen malli Latinalaisten neliöiden koeasetelman analysointi Laskutoimitusten suorittaminen

Lisätiedot

Harjoitus 7: NCSS - Tilastollinen analyysi

Harjoitus 7: NCSS - Tilastollinen analyysi Harjoitus 7: NCSS - Tilastollinen analyysi Mat-2.2107 Sovelletun matematiikan tietokonetyöt Syksy 2006 Mat-2.2107 Sovelletun matematiikan tietokonetyöt 1 Harjoituksen aiheita Tilastollinen testaus Testaukseen

Lisätiedot

Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen., jos otoskeskiarvo on suurempi kuin 13,96. Mikä on testissä käytetty α:n arvo?

Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen., jos otoskeskiarvo on suurempi kuin 13,96. Mikä on testissä käytetty α:n arvo? MTTTP5, kevät 2016 15.2.2016/RL Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen 1. Valitaan 25 alkion satunnaisotos jakaumasta N(µ, 25). Olkoon H 0 : µ = 12. Hylätään H 0, jos otoskeskiarvo

Lisätiedot

Data-analyysi II. Sisällysluettelo. Simo Kolppo [Type the document subtitle]

Data-analyysi II. Sisällysluettelo. Simo Kolppo [Type the document subtitle] Data-analyysi II [Type the document subtitle] Simo Kolppo 26.3.2014 Sisällysluettelo Johdanto... 1 Tutkimuskysymykset... 1 Aineistojen esikäsittely... 1 Economic Freedom... 1 Nuorisobarometri... 2 Aineistojen

Lisätiedot

SEM1, työpaja 2 (12.10.2011)

SEM1, työpaja 2 (12.10.2011) SEM1, työpaja 2 (12.10.2011) Rakenneyhtälömallitus Mplus-ohjelmalla POLKUMALLIT Tarvittavat tiedostot voit ladata osoitteesta: http://users.utu.fi/eerlaa/mplus Esimerkki: Planned behavior Ajzen, I. (1985):

Lisätiedot

pitkittäisaineistoissa

pitkittäisaineistoissa Puuttuvan tiedon käsittelystä p. 1/18 Puuttuvan tiedon käsittelystä pitkittäisaineistoissa Tapio Nummi tan@uta.fi Matematiikan, tilastotieteen ja filosofian laitos Tampereen yliopisto Puuttuvan tiedon

Lisätiedot

Mat Tilastollisen analyysin perusteet, kevät 2007

Mat Tilastollisen analyysin perusteet, kevät 2007 Mat-.104 Tilastollisen analyysin perusteet, kevät 007 8. luento: Usean selittäjän lineaarinen regressiomalli Kai Virtanen 1 Usean selittäjän lineaarinen regressiomalli Selitettävän muuttujan havaittujen

Lisätiedot

Mat Tilastollisen analyysin perusteet, kevät 2007

Mat Tilastollisen analyysin perusteet, kevät 2007 Mat-2.2104 Tilastollisen analyysin perusteet, kevät 2007 4. luento: Jakaumaoletuksien testaaminen Kai Virtanen 1 Jakaumaoletuksien testaamiseen soveltuvat testit χ 2 -yhteensopivuustesti yksi otos otoksen

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 16. marraskuuta 2007 Antti Rasila () TodB 16. marraskuuta 2007 1 / 15 1 Epäparametrisia testejä χ 2 -yhteensopivuustesti Homogeenisuuden testaaminen Antti

Lisätiedot

Mat Tilastollisen analyysin perusteet, kevät 2007

Mat Tilastollisen analyysin perusteet, kevät 2007 Mat-.04 Tilastollisen analsin perusteet, kevät 007. luento: Kaksisuuntainen varianssianalsi Kai Virtanen Kaksisuuntaisen varianssianalsin perusasetelma Jaetaan perusjoukko rhmiin kahden tekän A ja B suhteen

Lisätiedot

Puheentutkimuksen tilastoanalyysin perusteet. 8. luento. Pertti Palo 20.1.2012

Puheentutkimuksen tilastoanalyysin perusteet. 8. luento. Pertti Palo 20.1.2012 Puheentutkimuksen tilastoanalyysin perusteet 8. luento Pertti Palo 20.1.2012 Käytännön asioita Viimeisen seminaarin siirto: 2.3. 10-12 -> 2.3. 14-16. Miten seminaarin luentokuulustelun voi korvata? Harjoitustöiden

Lisätiedot

Vastepintamenetelmä. Heliövaara 1

Vastepintamenetelmä. Heliövaara 1 Vastepintamenetelmä Kurssipalautteen antamisesta saa hyvityksenä yhden tenttipisteen. Palautelomakkeeseen tulee lähiaikoina linkki kurssin kotisivuille. Heliövaara 1 Vastepintamenetelmä Vastepintamenetelmässä

Lisätiedot

1. Normaalisuuden tutkiminen, Bowmanin ja Shentonin testi, Rankit Plot, Wilkin ja Shapiron testi

1. Normaalisuuden tutkiminen, Bowmanin ja Shentonin testi, Rankit Plot, Wilkin ja Shapiron testi Mat-2.2104 Tilastollisen analyysin perusteet / Ratkaisut Aiheet: Avainsanat: Yhteensopivuuden ja homogeenisuden testaaminen Bowmanin ja Shentonin testi, Hypoteesi, 2 -homogeenisuustesti, 2 -yhteensopivuustesti,

Lisätiedot

2. Teoriaharjoitukset

2. Teoriaharjoitukset 2. Teoriaharjoitukset Demotehtävät 2.1 Todista Gauss-Markovin lause. Ratkaisu. Oletetaan että luentokalvojen standardioletukset (i)-(v) ovat voimassa. Huomaa että Gauss-Markovin lause ei vaadi virhetermien

Lisätiedot

Mat Tilastollisen analyysin perusteet, kevät 2007

Mat Tilastollisen analyysin perusteet, kevät 2007 Mat-.04 Tilastollisen analyysin perusteet, kevät 007 4. luento: Jakaumaoletuksien testaaminen Kai Virtanen Jakaumaoletuksien testaamiseen soveltuvat testit χ -yhteensopivuustesti yksi otos otoksen vertaaminen

Lisätiedot

Johdatus regressioanalyysiin. Heliövaara 1

Johdatus regressioanalyysiin. Heliövaara 1 Johdatus regressioanalyysiin Heliövaara 1 Regressioanalyysin idea Oletetaan, että haluamme selittää jonkin selitettävän muuttujan havaittujen arvojen vaihtelun selittävien muuttujien havaittujen arvojen

Lisätiedot

Tilastollisten menetelmien käyttö Kelan tutkimustoiminnassa

Tilastollisten menetelmien käyttö Kelan tutkimustoiminnassa Tilastollisten menetelmien käyttö Kelan tutkimustoiminnassa Risto Lehtonen Helsingin yliopisto Kela 1 Tilastokeskuksen SAS-seminaari 16.11.2009 Aiheita Kelan tutkimustoiminta SAS-sovellukset vaativien

Lisätiedot

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin Tilastollisen analyysin perusteet Luento 10: Sisältö Varianssianalyysi Varianssianalyysi on kahden riippumattoman otoksen t testin yleistys. Varianssianalyysissä perusjoukko koostuu kahdesta tai useammasta

Lisätiedot

1. USEAN SELITTÄJÄN LINEAARINEN REGRESSIOMALLI JA OSITTAISKORRELAATIO

1. USEAN SELITTÄJÄN LINEAARINEN REGRESSIOMALLI JA OSITTAISKORRELAATIO Mat-2.104 Tilastollisen analyysin perusteet / Ratkaisut Aiheet: Avainsanat Usean selittäjän lineaarinen regressiomalli Estimaatti, Estimaattori, Estimointi, Jäännösneliösumma, Jäännöstermi, Jäännösvarianssi,

Lisätiedot

Kemometriasta. Matti Hotokka Fysikaalisen kemian laitos Åbo Akademi Http://www.abo.fi/~mhotokka

Kemometriasta. Matti Hotokka Fysikaalisen kemian laitos Åbo Akademi Http://www.abo.fi/~mhotokka Kemometriasta Matti Hotokka Fysikaalisen kemian laitos Åbo Akademi Http://www.abo.fi/~mhotokka Mistä puhutaan? Määritelmiä Määritys, rinnakkaismääritys Mittaustuloksen luotettavuus Kalibrointi Mittausten

Lisätiedot

Tilastollisen analyysin perusteet Luento 7: Lineaarinen regressio

Tilastollisen analyysin perusteet Luento 7: Lineaarinen regressio Tilastollisen analyysin perusteet Luento 7: Lineaarinen regressio Sisältö Regressioanalyysissä tavoitteena on tutkia yhden tai useamman selittävän muuttujan vaikutusta selitettävään muuttujaan. Sen avulla

Lisätiedot

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1 Tilastotieteen kertaus Vilkkumaa / Kuusinen 1 Motivointi Reaalimaailman ilmiöihin liittyy tyypillisesti satunnaisuutta ja epävarmuutta Ilmiöihin liittyvien havaintojen ajatellaan usein olevan peräisin

Lisätiedot

RISTIINTAULUKOINTI JA Χ 2 -TESTI

RISTIINTAULUKOINTI JA Χ 2 -TESTI RISTIINTAULUKOINTI JA Χ 2 -TESTI Kvantitatiiviset tutkimusmenetelmät maantieteessä Ti 27.10.2015, To 2.11.2015 Miisa Pietilä & Laura Hokkanen miisa.pietila@oulu.fi laura.hokkanen@outlook.com KURSSIKERRAN

Lisätiedot

MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op)

MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op) MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op) Aalto-yliopisto 2017 Käytännön järjestelyt Luennot: Luennot maanantaisin (sali E) ja keskiviikkoisin (sali U4) klo 10-12 Luennoitsija: (lauri.viitasaari@aalto.fi)

Lisätiedot

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä arvon Sisältö arvon Bootstrap-luottamusvälit arvon arvon Oletetaan, että meillä on n kappaletta (x 1, y 1 ),

Lisätiedot

Jakaumien merkitys biologisissa havaintoaineistoissa: Löytyykö ratkaisu Yleistetyistä Lineaarisista (Seka)Malleista?

Jakaumien merkitys biologisissa havaintoaineistoissa: Löytyykö ratkaisu Yleistetyistä Lineaarisista (Seka)Malleista? 1 Hydrobiologian tutkijaseminaari 20.3.2000 Jakaumien merkitys biologisissa havaintoaineistoissa: Löytyykö ratkaisu Yleistetyistä Lineaarisista (Seka)Malleista? Jari Hänninen Turun yliopisto Saaristomeren

Lisätiedot

Aki Taanila VARIANSSIANALYYSI

Aki Taanila VARIANSSIANALYYSI Aki Taanila VARIANSSIANALYYSI 18.5.2007 VARIANSSIANALYYSI 1 JOHDANTO...2 VARIANSSIANALYYSI...3 Yksisuuntainen varianssianalyysi...3 Kaksisuuntainen varianssianalyysi ilman toistoja...6 Kaksisuuntainen

Lisätiedot

pitkittäisaineistoissa

pitkittäisaineistoissa Puuttuvan tiedon ongelma p. 1/18 Puuttuvan tiedon ongelma pitkittäisaineistoissa Tapio Nummi tan@uta.fi Matematiikan, tilastotieteen ja filosofian laitos Tampereen yliopisto mtl.uta.fi/tilasto/sekamallit/puupitkit.pdf

Lisätiedot

voidaan hylätä, pienempi vai suurempi kuin 1 %?

voidaan hylätä, pienempi vai suurempi kuin 1 %? [MTTTP1] TILASTOTIETEEN JOHDANTOKURSSI, Syksy 2017 http://www.uta.fi/sis/mtt/mtttp1/syksy_2017.html HARJOITUS 5 viikko 42 6.10.2017 klo 10:42:20 Ryhmät: ke 08.30 10.00 LS C6 Paajanen ke 10.15 11.45 LS

Lisätiedot

Oletetaan, että virhetermit eivät korreloi toistensa eikä faktorin f kanssa. Toisin sanoen

Oletetaan, että virhetermit eivät korreloi toistensa eikä faktorin f kanssa. Toisin sanoen Yhden faktorin malli: n kpl sijoituskohteita, joiden tuotot ovat r i, i =, 2,..., n. Olkoon f satunnaismuuttuja ja oletetaan, että tuotot voidaan selittää yhtälön r i = a i + b i f + e i avulla, missä

Lisätiedot