4. Satunnaistetut lohkokokeet, latinalaiset neliöt ja vastaavat asetelmat. Kiusatekijä on taustatekijä, joka voi vaikuttaa

Koko: px
Aloita esitys sivulta:

Download "4. Satunnaistetut lohkokokeet, latinalaiset neliöt ja vastaavat asetelmat. Kiusatekijä on taustatekijä, joka voi vaikuttaa"

Transkriptio

1 4. Satunnaistetut lohkokokeet, latinalaiset neliöt ja vastaavat asetelmat 4.1 Satunnaistettu lohkokoe (Randomized Block Design) Kiusatekijä (nuisance factor): Kiusatekijä on taustatekijä, joka voi vaikuttaa koetuloksiin, mutta siitä sinänsä ei olla kiinnostuneita. 1

2 Tavoite on eliminoida sen vaikutus koetuloksista. Eliminointimenetelmiä: Satunnaistaminen: Jos kiusatekijä ei ole havaittavissa, pyritään sen vaikutus poistamaan satunnaistamisella (randomization). Kovarianssianalyysi: Havaittavissa oleva kiusatekijä voidaan huomioida koetuloksissa kovariaatteina (lisämuuttujina). 2

3 Satunnaistettu täysi lohkokoe: [Randomized complete block design (RCBD)] Kiusatekijä on tunnistettavissa ja kontrolloitavissa. Kiusatekijän vaikutus eliminoidaan täydellä lohkokokeella, mikä tarkoittaa, että tehdään jokaiselle koeyksikölle (jokaisessa lohkossa) kaikki käsittelyt. Tyypillisesti tällainen tilanne on, kun tiedetään, että koeyksiköiden ominaispiirteet vaikuttavat koetuloksiin. Koeyksiköt (havaintoyksiöt) eivät ole homogeenisia. 3

4 Esimerkki 4.1: (ks. Esim 2.4) Halutaan tutkia antavatko metallin kovuuden tutkimisessa käytettävät neljä pistokärkeä samoja kovuustuloksia. Kullakin kärjellä halutaan tehdä neljä mittausta, eli yhteensä 5 4 = 16 mittausta. Kysymyksessä on yhden tekijän koeasetelma (tekijänä pistokärki). Jos toteutetaan täysin satuunnaistettu yhden faktorin koe, valitaan 16 testipalaa ja arvotaan kullekin pistokärjelle neljä palaa. Ongelmana kuitenkin on, että jos metallipalat ovat kovuuksiltaan erilaisia, vaikuttaa mittaustuloksiin pistokärjen ja satunnaisvirheen lisäksi myös metallipalan mahdollisesti vaihteleva ominaiskovuus. Ominaiskovuudet muodostavat tässä potentiaalisen kiusatekijän, joka kuitenkin voidaan eliminoida satunnaistetulla täydellä lohkokoeella. Menettely: Valitaan neljä metallipalaa ja tehdään mittaus jokaisessa palassa kullakin pistokärjellä (complete block design). Kussakin koepalassa mittausjärjestys on satunnainen (randomization). 4

5 Taulukko 4.1: Satunnaistettu täysi lohkokoe kovuusmittauskokeessa. =============================================================== Mittaus- Koepala Keskikarki Yhteensa Keskiarvo hajonta Yht Karv Khaj =============================================================== 5

6 Yleisesti satunnaistetun täyden lohkokokeen asetelma on muotoa: Taulukko 4.2: Randomized Complete Block Design lohko 1 lohko 2 lohko b käsittely 1 y 11 y 12 y 1b käsittely 2 y 21 y 22. y 2b käsittely a y a1 y a2 y ab Huom. 4.1: Jokaisessa lohkossa on yksi havainto per käsittely. Huom. 4.2: Käsittelyjen järjestys jokaisen lohkon sisällä on satunnainen. Täten satunnaistaminen tapahtuu vain lohkon sisällä 6

7 Tilastollinen malli Tilastollinen malli (eräs mahdollisuus) havainnoille voidaan RCBD-asetelmassa kirjoittaa muotoon (muista, että tilastollisen mallintamisessa kysymys on siitä, että mistä havaittu vaihtelu on peräisin) (1) y ij = μ + τ i + β j + ε ij, jossa μ on yleiskeskiarvo (overall mean), τ i on käsittelyn i vaikutus (treatment effect), β j on lohkon j vaikutus (block effect) ja satunnaisvirhe ε ij N(0, σ 2 ), i = 1,..., a, j = 1,..., b. Parametrit τ i ja β j ajatellaan poikkeamina keskiarvosta μ, jolloin (2) a i=1 τ i = b j=1 β j = 0. 7

8 Mallia (1) sanotaan vaikutusten esitysmuodoksi (vaikutusten malli tai efektien malli) (effects model) Vaihtoehtoisesti voidaan kirjoittaa odotusarvoesitys (mean model) (3) y ij = μ ij + ε ij, jossa μ ij = μ + τ i + β j. Jatkossa käytetään pääsääntöisesti efektien mallin esitystä. 8

9 Hypoteesit: Kysymys: Onko käsittelyillä vaikutusta? Testattavat hypotsseit: (4) H 0 : τ 1 = = τ a = 0 H 1 : τ i = 0 jollakin i Kokonaisvaihtelua mittaava neliösumma voidaan dekomponoida vaihtelun lähteiden mukaisesti (5) a i=1 b j=1 (y ij y.. ) 2 = b a i=1 ( y i. y.. ) 2 +a b j=1 ( y.j y.. ) 2 + a i=1 b j=1 (y ij y.j y i. + y.. ) 2 eli (6) SS tot = SS treat + SS block + SS err, 9

10 jossa (7) SS tot = a b i=1 j=1 (y ij y.. ) 2 on kokonaisneliösumma, (8) SS treat = b a i=1 ( y i. y.. ) 2 on käsittelyjen osuus SS tot :sta, (9) SS block = b b j=1 ( y.j y.. ) 2 on lohkojen välisen vaihtelun osuus SS tot :sta ja (10) SS err = a b i=1 j=1 (y ij y i. y.j + y.. ) 2 on virhevaihtelun osuus kokonaisvaihtelusta. 10

11 Edellä (11) y i. = 1 b (12) y.j = 1 a ja b y ij j=1 a y ij i=1 (13) y.. = 1 ab a b i=1 j=1 y ij. 11

12 Vapausasteet: SS tot : N 1, jossa df tot = N = ab, SS treat : df treat = a 1, SS block : df block = b 1 ja SS err : df err = ab (a 1) (b 1) = (a 1)(b 1) Keskineliöt: Jakamalla neliösummat vapausasteillaan saadaan keskineliösummat, joita voidaan käyttää samalla varianssien estimaattoreina. (14) MS treat = SS treat a 1, (15) MS block = SS block b 1, (16) MS err = SS err (a 1)(b 1). 12

13 Testisuure: Hypoteesin (4) testaus perustuu testisuureeseen (17) F = MS treat MS err, joka on F -jakautunut vapausasteilla a 1 ja (a 1)(b 1), jos H 0 on tosi. 13

14 Varianssitaulu: Vaihtelun Neliö- Vapaus- Keskilähde summa asteet neliöt F MS Käsittely SS treat a 1 MS treat treat MS err Lohkot SS block b 1 MS block Virhe SS err (a 1)(b 1) MS err Yhteensä SS tot N 1 Periaatteessa testisuuretta F block = MS block /MS err voidaan käyttää myös lohkovaikutusten testaamiseen (H 0 : β 1 = = β b = 0). Kuitenkin satunnaistaminen on tehty vain lohkojen sisällä, minkä seurauksena testi ei ole täysin validi. Käytännön ratkaisuna on, että käytetään sitä deskriptiivisenä suureena; jos F block on suuri on syytä lohkominen tehdä myös vastaavissa kokeissa myöhemminkin. 14

15 Esimerkki 4.2: Metallin kovuustestiaineisto. Alla olevassa kuviossa havainnot on koepaloittain (Test coupon). Hardness Testing Experiment Type of Tip Test Coupon Tip 1 Tip 2 Tip 3 Tip 4 Kuvion perusteella on ilmeistä, että koepalat ovat eri kovuisia, joten vaikutus on syytä eliminoida ennen kärkien mittaustuloksien analyysissa. 15

16 SAS-ajojono RCBD:lle: options ls = 78; /* Data from Montgomery 5 ed, p. 127 */ data hardness; input tip coupon y datalines; ; proc anova data = hardness; class tip coupon; model y = tip coupon; run; 16

17 Tulokset: The ANOVA Procedure Class Level Information Class Levels Values tip coupon Number of observations 16 Dependent Variable: y Sum of Source DF Squares Mean Square F Value Pr > F Model <.0001 Error Corrected Total R-Square Coeff Var Root MSE y Mean Source DF Anova SS Mean Square F Value Pr > F tip coupon <.000 Ensimmäisessä taulukossa on yhditetty testaus, jossa on käsittelyn ja lohkon vaikutus yhdessä. Alemmassa taulukossa käsittelyn ja lohkon vaikutukset ovat erikseen. Kaikki p-arvo ovat < 0.001, joten kärjet antavat erilaisia tuloksia. Samoin lohkovaikutuksella on merkitystä, joten se on syytä huomioida. 17

18 Itse asiassa, jos lohkovaikutusta ei huomioitaisi ja analyysi olisi tehty tavanomaisena yhden faktorin kokeena, olisi tulokset seuraavanlaisia: Sum of Source DF Squares Mean Square F Value Pr > F Model Error Corrected Total Näiden tulosten mukaan mittauskärkein antamilla tuloksilla ei olisi eroa, mikä olisi mitä ilmeisemmin virheellinen johtopäätös! 18

19 Keskiarvojen yksittäiset vertailut voidaan tehdä samalla tavalla kuin yhden faktorin kokeessa. Esimerkki 4.3: Tarkastellaan esimerkkinä LSD ja Tukey vertailuja (proc anova käsky means tip / lsd tukey;) The ANOVA Procedure t Tests (LSD) for y NOTE: This test controls the Type I comparisonwise error rate, not the experimentwise error rate. Alpha 0.05 Error Degrees of Freedom 9 Error Mean Square Critical Value of t Least Significant Difference Means with the same letter are not significantly different. t Grouping Mean N tip A B B B B B

20 Tukey s Studentized Range (HSD) Test for y NOTE: This test controls the Type I experimentwise error rate, but it generally has a higher Type II error rate than REGWQ. Alpha 0.05 Error Degrees of Freedom 9 Error Mean Square Critical Value of Studentized Range Minimum Significant Difference Means with the same letter are not significantly different. Tukey Grouping Mean N tip A B B B B B Havaitaan, että eron aiheutta mittauskärki 4. 20

21 Mallin riittävyystarkastelut Residuaalit (18) ˆe ij = y ij ˆy ij = y ij (ˆμ + ˆτ i + ˆβ j ) = y ij y i. y.j + y.. jossa ˆμ = y.., ˆτ i = y i. y.. ja ˆβ j = y.j y... Näihin perustuen normaalisuus ja vakiovarianssisuus tarkastelut tehdään kuten kappaleessa 3. Huom 4.3: Havainnon y ij ennustearvo (19) ˆy ij = ˆμ + ˆτ i + ˆβ j = y.. + ( y i. y.. ) + ( y.j y.. ) = y i. + y.j y.. 21

22 Residual normal probability plot and Residuals versus predicted values Residual plots against coupon and tip No obvious non-normalities or non-linearities. 22

23 4.2 Latinalaiset neliöt Latinalaisten neliöiden koeasetelmalla voidaan eliminoida kahden kiusatekijän vaikutus koetuloksista (havainnot ovat kahden taustatekijän suhteen mahdollisesti epähomogeenisia). Perusajatus: käytetään kiusafaktoreita (nuisance factors) lohkomuuttujina (blocking variables). 23

24 Asetelma: (a) Käsittelyn (treatment) tasoja p ( 3). Molemmilla kiusafaktoreilla myös p luokkaa. (b) Muodostetaan kiusafaktoreiden luokkien mukaisesti p p taulukko. (c) Kullakin rivillä ja kullakin sarakkeella toteutetaan jokainen käsittely (treatment) täsmälleen kerran (kokeita yhteensä p 2 ja jokaisesta käsittelytasolta saadaan p havaintoa). Huom 4.4: Koeasetelmaa, jossa kullakin käsittely (treatment) tehdään täsmälleen kerran kussakin taustatekijöiden (blocking variables) määrittämässä solussa, sanotaan ortogonaaliseksi. 24

25 Etuja: (a) Yleisesti latinalaisten neliöiden koesuunnitelmilla (latinalaiset neliöt, kreikkalais-latinalaiset neliöt, hyper-kreikkalais-latinalaiset neliöt) voidaan eliminoida useamman kiusatekijän vaikutukset (b) Tarvitaan vain suhteellisen vähän koetoistoja (Latinalaisessa neliössä p 2 ). 25

26 Rajoitteita: (a) Kiusatekijöillä täytyy olla täsmälleen yhtä monta tasoa kuin käsittelyfaktorilla (p tasoa) (b) Kiusatekijöiden välillä ei saa olla yhdysvaikutusta (interaction). Myöskään kiusatekijöiden ja käsittelyfaktorin ei saa olla yhdysvaikutuksia. 26

27 Esimerkki 4.4: Tarkastellaan suihkumoottoreille tarkoitetun viiden erilaisen polttoaineseoksen palamisominaisuuksia. Kustakin raaka-aineet-erästä saadaan valmistettua erä kutakin polttoaineseosta. Seokset on mahdollista teettää viidellä eri toimittajalla. Käsittelytekijänä (treatment) on siis seos ja taustatekijöinä (kiusafaktorit) raaka-aine-erät ja toimittajat. Koeasetelma: Valmistetaan kustakin raaka-aine-erästä jokaista seostyyppiä yksi erä siten, että kukin toimittaja valmistaa yhden erän jokaista seosta, joista kunkin muodostuu eri raaka-aine-eristä. 27

28 Merkitään seoksia (käsittelyjä) aakkosilla A, B, C, D ja E, saadaan esitys, jota sanotaan latinalaiseksi neliöksi (latinalaiseten aakkosten vuoksi) Polttoaineen palamisominaisuudet ============================================================= Raaka-aine- Toimittaja (column) era (row) A = 24 B = 20 C = 19 D = 24 E = 24 2 B = 17 C = 24 D = 30 E = 27 A = 36 3 C = 18 D = 38 E = 26 A = 27 B = 21 4 D = 26 E = 31 A = 26 B = 23 C = 22 5 E = 22 A = 30 B = 20 C = 29 D = 31 ============================================================= Tärkeää on, että raaka-aineet ja toimittajat eri seoksille tulee valittua satunnaisesti. Yllä oleva neliö on yksi perusneliöistä. Permutoimalla sarakkeita ja rivejä saadaan muut neliöt. Satunnaistaminen toteutuu siten, että valitaan kaikista mahdollisita neliöistä toteutettava satunnaisesti. 28

29 Latinalaista neliötä, jossa ensimmäinen rivi ja sarake ovat aakkosjärjestyksessä sanotaan standardineliöksi (standard Latin square). Esimerkkeja standardineliosita: ================================================================= 3x3 4x4 5x5 6x A B C A B C D A B C D E A B C D E F B C A B C D A B C D E A B C D E F A C A B C D A B C D E A B C D E F A B D A B C D E A B C D E F A B C E A B C D E F A B C D F A B C D E n of std squares total n of squares number of runs ================================================================= 29

30 Tilastollinen malli: p p latinalaisen neliön malli havainnolle on muotoa (20) y ijk = μ + α i + τ j + β k + ε ijk, i = 1,..., p (rivitekijä), j = 1,..., p (käsittely [treatment]), k = 1,..., p (saraketekijä). Esimerkki 4.5: (Jatkoa) Jos i = 2, k = 3, niin j = 4(= D) ja y 143 = 30. Virhetermille pätee E[ε ijk ] = 0 ja Var[ε ijk ] = σ 2 ε. Kuten lohkokokeessa, α i, τ j ja β k ovat poikkeamia yleiskeskiarvosta ja summautuvat nolliksi. Perusoletuksena on siis, että tekijöiden (faktoreiden) välillä ei ole yhdysvaikutusta (interaction). 30

31 Havaintojen lukumäärä: N = p 2. Varianssiahjoitelma: (21) SS tot = SS row + SS column + SS treat + SS err, jossa (22) SS tot = (y ijk y) 2, (23) SS row = p (24) SS col = p (25) SS treat = p (26) i,j,k p i=1 p k=1 p j=1 ( y i.. y) 2, ( y..k y) 2, ( y.j. y) 2, SS err = SS tot SS row SS col SS treat. 31

32 Varianssitaulu: Source of Sum of Degrees of Mean variation squares freedom square F Treatments SS treat p 1 MS treat MS treat MS err Rows SS row p 1 MS row MS row MS err Columns SS col p 1 MS col MS col MS err Error SS err (p 2)(p 1) MS err Total SS tot p 2 1 Pääasiallinen kiinnostus on käsittelyn vaikutuksessa. Huom. 4.5: Varianssihajotelma noudattaa havaitun arvon y ijk dekomponointia (27) y ijk y... = ( y i. y... ) + ( y.j. y... ) + ( y..k y... ) eli +(y ijk y i.. y.j. y..k + 2 y... ) (28) tot = row + treat + col + err. 32

33 Esimerkki 4.6: Polttoaine-esimerkki. SAS:lla toteutettuna ajovirta on seuraava: data propellant; input y batch treat $ operator; label y = "burning rate"; datalines; 24 1 A B C D E B C D E A C D E A B D E A B C E A B C D 5 ; proc anova data = propellant; class batch treat operator; model y = batch treat operator; run; 33

34 Tulokset: The SAS System The ANOVA Procedure Class Level Information Class Levels Values batch treat 5 A B C D E operator Number of Observations Read 25 Number of Observations Used 25 The ANOVA Procedure Dependent Variable: y burning rate Sum of Source DF Squares Mean Square F Value Pr > F Model Error Corrected Tot R-Square Coeff Var Root MSE y Mean Source DF Anova SS Mean Square F Value Pr > F batch treat operator

35 Ylemmässä varianssitaulun F -testi testaa onko millään tekijällä vaikutusta. Alemman varianssitaulun F -testit testaavat kunkin yksittäisen tekijän vaikutusta. Tuloksista havaitaan, että eri seoksien keskimääräiset palamistulokset poikkeavat toisistaan tilastollisesti merkitsevästi. Lisäksi eri toimittajien seoksilla on vaikutusta palamistulokseen. Sen sijaan raaka-aine-erillä ei näytä olevan vaikutusta. 35

36 Mallin (20) parametrien estimaattorit ovat (29) ˆμ = y = y... = 1 N (30) ˆα i = y i.. y..., (31) ˆτ j = y.j. y..., y ijk i,j,k (32) ˆβ k = y..k y... (33) ˆy ijk = ˆμ + ˆα i + ˆτ j + ˆβ k. 36

37 Maliin riittävyyden tarkastelut: Jos malli on riittävä, residuaalit ovat puhtaasti satunnaisvaihtelua Residuaalit: (34) e ijk = y ijk ˆy ijk = y ijk y i.. y.j. y..k + 2 y... Graafisilla tarkasteluilla saadaan yleissilmäys tilanteesta. 37

38 Esimerkki 4.6: Normal probability plot and residual versus predicted Treatment versus residual and operator versus residual Normaaliisuus on jokseenkin ok, eikä ilmeisiä epälineaarisuuksia. 38

39 4.3 Kreikkalais-latinalaiset neliöt Kolme taustatekijää (nuisance factors). Käsitellään ne lohkomuuttujina. Asetelma: (a) Käsittelytasoja ja taustamuuttujien tasoja p ( 4). (b) Lähtökohtana p p latinalainen neliö, jonka päälle määritellään toinen latinalainen neliö. Käsittelyn tasoja merkitään kreikkalaisilla kirjaimilla (tästä nimi) ja kolmannen taustatekijän tasoja latinalaisilla kirjaimilla. Sarakevaikutukset Rivi Aα Bβ Cγ Dδ 2 Bδ Aγ Dβ Cα 3 Cβ Dα Aδ Bγ 4 Dγ Cδ Bα Aβ 39

40 Huom 4.6: Kysymyksessä jälleen ns. ortogonaalinen asetelma siinä mielessä, että kullakin taustatekijän tasolla käsittely toistetaan täsmälleen kerran. Tilastollinen malli: (35) y ijkl = μ + θ i + τ j + ω k + l + ε ijkl, i, j, k, l = 1,..., p. Rivi: θ i (lohkotekijä) Sarake: l (lohkotekijä) Latinalainen aakkonen: τ j (treatment) Kreikkalainen aakkonen: ω k (lohkotekijä) 40

41 Määrittelemällä kesiarvot indeksien yli kuten edellä, saadaan estimaattorit (36) ˆμ = y... = 1 N jossa N = p 2 i,j,k,l (37) ˆθ i = y i... y..., y ijkl, (38) ˆτ j = y.j.. y..., (39) ˆω k = y..k. y..., (40) ˆl = y...l y... ja sovitearvo (fitted value) (41) ˆy ijkl = ˆμ + ˆθ i + ˆτ j + ˆω k + ˆl = y... + ( y i... y... ) + ( y.j.. y... ) +( y..k. y... ) + ( y...l y... ) 41

42 Residuaali termi: (42) e ijkl = y ijkl ˆy ijkl Varianssitaulu: Source SS df M S F Latin SS latin p 1 MS latin MS latin MS err Greek SS greek p 1 MS greek MS greek MS err Rows SS row p 1 MS row MS row MS err Columns SS rol p 1 MS rol MS rol MS err Error SS err (p 3)(p 1) MS err Total SS tot p 2 1 jossa esimerkiksi (43) SS latin = p p j=1 ( y.j.. y... ) 2 42

43 Esimerkki 4.7: Polttoaine-esimerkki. Oletetaan, että kokeet tehdään viidellä eri testimoottorilla, joiden mahdollinen vaikutus halutaan eliminoida. Identifioidaan moottorit kreeikkalaisilla aakkosilla ja oletetaan, että koe on toteutettu seuraavasti: Raaka-aine- Toimittaja (column) era (row) Aα = 24 Bγ = 20 Cε = 19 Dβ = 24 Eδ = 24 2 Bβ = 17 Cδ = 24 Dα = 30 Eγ = 27 Aε = 36 3 Cγ = 18 Dε = 38 Eβ = 26 Aδ = 27 Bα = 21 4 Dδ = 26 Eα = 31 Aγ = 26 Bε = 23 Cβ = 22 5 Eε = 22 Aβ = 30 Bδ = 20 Cα = 29 Dγ = 31 43

44 data propellant; input y batch treat $ operator assembly $; label y = "burning rate"; datalines; 24 1 A 1 alpha 17 2 B 1 beta 18 3 C 1 gamma 26 4 D 1 delta 22 5 E 1 epsilon 20 1 B 2 gamma 24 2 C 2 delta 38 3 D 2 epsilon 31 4 E 2 alpha 30 5 A 2 beta 19 1 C 3 epsilon 30 2 D 3 alpha 26 3 E 3 beta 26 4 A 3 gamma 20 5 B 3 delta 24 1 D 4 beta 27 2 E 4 gamma 27 3 A 4 delta 23 4 B 4 epsilon 29 5 C 4 alpha 24 1 E 5 delta 36 2 A 5 epsilon 21 3 B 5 alpha 22 4 C 5 beta 31 5 D 5 gamma ; proc anova data = propellant; class batch treat assembly operator; model y = batch treat assembly operator; run; 44

45 Results: The ANOVA Procedure Dependent Variable: y burning rate Sum of Source DF Squares Mean Square F Value Pr > F Model Error Corrected Tot R-Square Coeff Var Root MSE y Mean Source DF Anova SS Mean Square F Value Pr > F batch treat assembly operator Testimoottorilla (assemmpply) ei näytä olevan vaikutusta (p-arvo ). 45

46 Parittaisten (ortogonaalisten) latinalaisten asetelma, joka muodostaa kreikkalais-latinalaisen neliön, voidaan yleistää edelleen. p p hyperneliö on koeasetelma, joka muodostetaan kolmesta tai useammmasta ortogonaalinen latinalaisesta neliöstä. p 1:stä ortogonaalisesta latinalaisesta neli - ostä voidaan muodostaa asetelma, jolla periaatteessa voidaan tutkia p + 1:n tekijän vaikutusta. 46

47 4.4 Balansoitu epätäydellisen lohkokoe (Balanced Incomplete Block Design, BIBD) Kaikkia käsittelyitä (treatments) ei toteuteta jokaisessa lohkossa (epätäydellinen, incomplete). Kuitenkin kaikkia käsittelykombinaatioita pidetään yhtä tärkeinä. Tällöin koe toteutetaan site, että jokainen käsittelypari esiintyy yhtä monta kertaa (balansoitu [balanced] Lähtökohta: Olkoon käsittelyn tasoja a ja jokaisessa lohkossa voidaan toteuttaa k < a koetta. 47

48 Koeasetelma: Periaatteessa koeasetelma voidaan toteuttaa siten, että valitaan (44) b = a k ) = a! k!(a k)! lohkoa ja totetutetaan kussakin yksi k alkion (käsittelyn) kombinaatio satunnaistetussa järjestyksessä. Huom. 4.7: Usein balanssi saadaan aikaiseksi pienemmällä kuin ( a k) lohkomäärällä. Kirjallisuudesta löytyy sopivia BIBD-taulukoita pienemmille lohkomäärille. 48

49 Esimerkki 4.7: Makesivalmistaja haluaa testata asiakkailla kuutta uutuustuotetta (A, B, C, D, E, F). Asiakkaita pyydetään maistamaan tuotteita ja pisteyttämään ne skaalalla Käytännön syistä kutakin koehenkilöä pyydetään maistamaan neljää tuotetta. Kokeeseen valitaan b = 15 = ( 6 4) henkilöä (lohkot) =============================================== Koehenkilo Pistemaara (tuote) [lohko, block] [kasittely, treatment]) (A) 55 (B) 69 (C) 83 (D) 2 48 (A) 87 (D) 56 (E) 22 (F) 3 65 (B) 91 (C) 67 (E) 35 (F) 4 42 (A) 48 (B) 65 (C) 43 (E) 5 36 (A) 58 (B) 69 (D) 7 (F) 6 79 (C) 85 (D) 56 (E) 25 (F) 7 54 (A) 60 (B) 90 (C) 21 (F) 8 62 (A) 92 (C) 94 (D) 63 (E) 9 39 (B) 71 (D) 47 (E) 11 (F) (A) 59 (B) 84 (D) 51 (E) (A) 74 (C) 61 (E) 25 (F) (B) 78 (C) 78 (D) 22 (F) (A) 74 (B) 59 (E) 32 (F) (A) 74 (C) 78 (D) 34 (F) (B) 83 (C) 92 (D) 68 (E) =============================================== 49

50 Satunnausistaminen on toteutettu siten, että kullekin tuotekombinaatio on jaettu satunnaisesti koehenkilöille ja maistamisjärjestys on permutoitu satunnaiseksi kunkin koehenkilön kohdalla. 50

51 Esittämällä havaintoaineisto seuraavasti nähdään selkeämmin koeasetelma. ========================================== Brand Block Subj. A B C D E F Aver Aver = grand mean ========================================== 51

52 BIBD:n tilastolinen analysointi Kästittelyjen lukumäärä: a. Lohkojen lukumäärä: b. Kussakin lohkossa k käsittelyä (k < a). Toistoja r, eli jokainen käsittely toistuu r kertaa. Havaintoja: N = ar = bk. Kukin käsittelypari esiintyy (45) λ = lohkossa. r(k 1) a 1 Jos a = b, sanotaan koeasetelmaa symmetriseksi. 52

53 Esimerkki 4.8: Makutesti. a = 6, b = 15, k = 4, r = 10, N = 6 10 = 15 4 = 60 ja λ = 10(4 1) 6 1 = 30 5 = 6. 53

54 BIBD:n tilastollinen on samaa muotoa kuin RCBD:n (Randomized Complete Block Design), [kaava (1], eli (46) y ij = μ + τ i + β j + ε ij, jossa y ij on havainto i lohkossa j. Parametri μ on yleiskeskiarvo, τ i on käsittelyn i vaikutus, β j on lohkon j vaikutus ja ε ij on virhetermi. Jälleen a i=1 τ i = 0 ja b j=1 β j = 0. Kokonaisvaihtelu voidaan dekomponoida joko (47) SS tot = SS treat(adj) + SS block + SS err, tai (48) SS tot = SS treat + SS block(adj) + SS err. 54

55 Varianssitaulu: Source SS df MS F Treatment SS treat(adj) a 1 Block SS block(adj) b 1 Error SS err N a b + 1 Total SS tot N 1 SS treat(adj) a 1 SS block(adj) b 1 F = MS treat(adj) MS err F = MS block(adj) MS err Huom. 4.8: Yllä SS tot = SS treat(adj) + SS block(adj) + SS err, koska koeasetelma ei ole enää ortogonaalinen. 55

56 SS treat(adj) ja SS block(adj) lasketaan tavalla, jossa huomioidaan, ettei kaikkia käsittelyjä ole toteutettu jokaisessa lohkossa. SAS:n proc glm ja SPSS:n General Linear Model estimoinnissa nämä saadaan Sum of Squares Type III valinnoilla. 56

57 Teknisesti tämä tapahtuu siten, että estimoidaan ensin koko malli, jossa on molemmat efektit (treatment ja block). Estimointi tapahtuu regressiotekniikalla Saadaan neliösummahajotelma (49) SS tot = SS model.full + SS err Estimoidaan seuraavaksi malli, jossa on vain block tekijä (50) SS tot = SS model.block + SS err.block SS treat(adj) saadaan erotuksena (51) SS treat(adj) = SS model.full SS model.block 57

58 Vastaavsti SS block(adj) saadaan estimoimalla ensin treat efektin malli, josta (52) SS tot = SS model.treat + SS err.treat ja (53) SS block(adj) = SS model.full SS model.treat. 58

59 Esimerkki 4.9: Makutesti SAS-toteutus, proc glm Ensiksi luodaan data: data taste; input koehenkilo pisteet tuote $ label koehenkilo = "block variable"; label tuote = "treatment variable"; datalines; 1 51 A 1 55 B 1 69 C 1 83 D 2 48 A 2 87 D 2 56 E 2 22 F 3 65 B 3 91 C 3 67 E 3 35 F 4 42 A 4 48 B 4 65 C 4 43 E 5 36 A 5 58 B 5 69 D 5 7 F 6 79 C 6 85 D 6 56 E 6 25 F 7 54 A 7 60 B 7 90 C 7 21 F 8 62 A 8 92 C 8 94 D 8 63 E 9 39 B 9 71 D 9 47 E 9 11 F A B D E A C E F B C D F A B E F A C D F B C D E ; run; Toteutetaan proc glm:llä proc glm data = taste; class koehenkilo tuote; model pisteet = koehenkilo tuote / ss3; run; quit; 59

60 Tulokset: The GLM Procedure Class Level Information Class Levels Values koehenkilo tuote 6 A B C D E F Number of Observations Read 60 Number of Observations Used 60 The GLM Procedure Dependent Variable: pisteet Sum of Source DF Squares Mean Square F Value Pr > F Model <.0001 Error Corrected Total R-Square Coeff Var Root MSE pisteet Mean Source DF Type III SS Mean Square F Value Pr > F koehenkilo <.0001 tuote <

61 Koska p-arvot jäävät pieniksi on selvästi pääteltävissä, että tuotteiden keskimääräiset pistemäärät poikkeavat toisistaan, eli jotkut tuotteest maistuvat selvästi paremmilta kuin toiset. Yksittäisten keskiarvojen tarkasteluilla (monivertailutestit) saadaan selville parhaimmin maistuvat tuotteet. Koehenkilöiden välillä on myös eroa, joten tämän aiheuttaman vaihtelun huomiointi on perusteltua kokeessa. 61

62 Keskiarvo vertailut (Tukey): The GLM Procedure Tukey s Studentized Range (HSD) Test for pisteet NOTE: This test controls the Type I experimentwise error rate, but it generally has a higher Type II error rate than REGWQ. Alpha 0.05 Error Degrees of Freedom 40 Error Mean Square Critical Value of Studentized Range Minimum Significant Difference Means with the same letter are not significantly different. Tukey Grouping Mean N tuote A D A A C B B B B E C A D F 62

63 Tuotteiden D ja C makuominaisuuksissa ei ole merkittävää eroa. Samoin tuotteet B ja E ovat makuominaisuuksiltaan samanlaisia. Heikoimmin pärjää D, joka poikkeaa tilastollisesti merkitsevästi toisista. 63

Christina Gustafsson. Tilastollinen tietojenkäsittely STAT2100 IBM SPSS Statistics 20 for Windows Osa 2

Christina Gustafsson. Tilastollinen tietojenkäsittely STAT2100 IBM SPSS Statistics 20 for Windows Osa 2 Christina Gustafsson Tilastollinen tietojenkäsittely STAT2100 IBM SPSS Statistics 20 for Windows Osa 2 Kevät 2013 SISÄLLYSLUETTELO 5. YKSIULOTTEISET JAKAUMAT... 2 5.1. Frequencies-proseduuri... 2 5.2.

Lisätiedot

Aki Taanila MÄÄRÄLLISEN AINEISTON KERÄÄMINEN

Aki Taanila MÄÄRÄLLISEN AINEISTON KERÄÄMINEN Aki Taanila MÄÄRÄLLISEN AINEISTON KERÄÄMINEN 19.5.2014 SISÄLLYS 0 JOHDANTO... 1 1 LAADULLINEN VAI MÄÄRÄLLINEN?... 2 2 TUTKIMUSPROSESSI... 3 2.1 Suunnittelu... 3 2.2 Toteutus... 5 3 EI-KOKEELLINEN TUTKIMUSASETELMA...

Lisätiedot

Aki Taanila SPSS OPAS

Aki Taanila SPSS OPAS Aki Taanila SPSS OPAS 2.10.2009 SISÄLLYS 0 JOHDANTO... 1 1 AINEISTON TALLENTAMINEN... 2 1.1 Muuttujien määrittely... 2 1.2 Aineiston syöttäminen... 5 1.3 Aineiston tallentaminen ja avaaminen... 6 1.4 Aineistojen

Lisätiedot

Opas toimintakyvyn mittarin arviointiin TOIMIA-verkostossa (1.0) 1.6.2014

Opas toimintakyvyn mittarin arviointiin TOIMIA-verkostossa (1.0) 1.6.2014 Opas toimintakyvyn mittarin arviointiin TOIMIA-verkostossa (1.0) 1.6.2014 Kirjoittajat: Heli Valkeinen, Erikoistutkija, TtT, Terveyden ja hyvinvoinninlaitos Heidi Anttila, Erikoistutkija, TtT, Terveyden

Lisätiedot

Aki Taanila. IBM SPSS Statistics 21

Aki Taanila. IBM SPSS Statistics 21 Aki Taanila IBM SPSS Statistics 21 23.1.2013 SISÄLLYS 0 JOHDANTO... 1 1 AINEISTO... 3 1.1 Excel- tai teksti-muotoisen aineiston avaaminen... 3 1.2 Muuttujien määrittelyt... 3 1.3 Aineiston syöttäminen...

Lisätiedot

1.Kuvauksen lähtöaineisto

1.Kuvauksen lähtöaineisto 1.Kuvauksen lähtöaineisto 1 Tieteen tehtävänä on uuden tiedon hankkiminen. Käyttäytymistieteet tutkivat elollisten olioiden käyttäytymistä voidakseen ymmärtää sitä tai ainakin löytääkseen siitä säännönmukaisuuksia;

Lisätiedot

DISKREETTI MATEMATIIKKA

DISKREETTI MATEMATIIKKA DISKREETTI MATEMATIIKKA 1 2 DISKREETTI MATEMATIIKKA Sisällysluettelo 1. Relaatio ja funktio 3 1.1. Karteesinen tulo 3 1.2. Relaatio ja funktio 3 2. Kombinatoriikkaa 8 2.1. Tulo- ja summaperiaate 9 2.2.

Lisätiedot

Peruskoululaisten yhteiskunnallisen osaamisen estimointi sekamallilla: sovellus ICCS 2009 -aineistoon. Tilastotieteen pro gradu -tutkielma

Peruskoululaisten yhteiskunnallisen osaamisen estimointi sekamallilla: sovellus ICCS 2009 -aineistoon. Tilastotieteen pro gradu -tutkielma Peruskoululaisten yhteiskunnallisen osaamisen estimointi sekamallilla: sovellus ICCS 2009 -aineistoon Tilastotieteen pro gradu -tutkielma Tuomo Huttu Matematiikan ja tilastotieteen laitos Jyväskylän yliopisto

Lisätiedot

Puheentutkimuksen tilastoanalyysin perusteet. 8. luento. Pertti Palo 20.1.2012

Puheentutkimuksen tilastoanalyysin perusteet. 8. luento. Pertti Palo 20.1.2012 Puheentutkimuksen tilastoanalyysin perusteet 8. luento Pertti Palo 20.1.2012 Käytännön asioita Viimeisen seminaarin siirto: 2.3. 10-12 -> 2.3. 14-16. Miten seminaarin luentokuulustelun voi korvata? Harjoitustöiden

Lisätiedot

KUNNALLISEN PÄIVÄHOIDON YKSIKKÖKUSTANNUKSET: MIKSI KUNNAT OVAT NIIN ERILAISIA?

KUNNALLISEN PÄIVÄHOIDON YKSIKKÖKUSTANNUKSET: MIKSI KUNNAT OVAT NIIN ERILAISIA? VATT-TUTKIMUKSIA 119 VATT RESEARCH REPORTS Aki Kangasharju Juho Aaltonen KUNNALLISEN PÄIVÄHOIDON YKSIKKÖKUSTANNUKSET: MIKSI KUNNAT OVAT NIIN ERILAISIA? Valtion taloudellinen tutkimuskeskus Government Institute

Lisätiedot

MITEN TÄÄ MUKA MITTAA MUSIKAALISUUTTA? Vertaileva tutkimus Kai Karman musikaalisuustestistä ja jäljittelyyn perustuvasta musikaalisuustestistä

MITEN TÄÄ MUKA MITTAA MUSIKAALISUUTTA? Vertaileva tutkimus Kai Karman musikaalisuustestistä ja jäljittelyyn perustuvasta musikaalisuustestistä MITEN TÄÄ MUKA MITTAA MUSIKAALISUUTTA? Vertaileva tutkimus Kai Karman musikaalisuustestistä ja jäljittelyyn perustuvasta musikaalisuustestistä Tiina Kolehmainen Musiikkitieteen kandidaatintutkielma 28.5.2009

Lisätiedot

Karttojen värittäminen

Karttojen värittäminen Karttojen värittäminen Neliväriongelman värityskombinaatioiden lukumäärän etsiminen graafien avulla Eero Räty & Samuli Thomasson Valkeakosken Tietotien lukio / Päivölän Kansanopisto Tieteenala: Matematiikka

Lisätiedot

$ $($( )) * + $ $((,%- # $((,%- $ ($(. +/ $ (( 0 $ (( 0 1 $

$ $($( )) * + $ $((,%- # $((,%- $ ($(. +/ $ (( 0 $ (( 0 1 $ "# %%&% ' (( )) * + ((,%- # ((,%- ((. +/ (( 0 (( 0 1 ((, # ( (, ' ( ( 2)'/) ( ( / (#( &30 (#( +))'+) (#( +))'+) " (#( 0 (#( &30 4 ("( &30 # ("( +)/) # ("( 5 * " ("( 6* # ("( 7 ) # (( ' #4 (( 2 #4 (( &30

Lisätiedot

Kreikkalainen historioitsija Herodotos kertoo, että Niilin tulvien hävittämät peltojen rajat loivat maanmittareiden

Kreikkalainen historioitsija Herodotos kertoo, että Niilin tulvien hävittämät peltojen rajat loivat maanmittareiden MAB2: Geometrian lähtökohdat 2 Aluksi Aloitetaan lyhyellä katsauksella geometrian historiaan. Jatketaan sen jälkeen kuvailemalla geometrian atomeja, jotka ovat piste ja kulma. Johdetaan näistä lähtien

Lisätiedot

3.5 Todennäköisyyden laskumenetelmiä

3.5 Todennäköisyyden laskumenetelmiä MAB5: Todennäköisyyden lähtökohdat 3.5 Todennäköisyyden laskumenetelmiä Aloitetaan esimerkillä, joka on sitä sarjaa, mihin ei ole mitään muuta yleispätevää ohjetta kuin että on edettävä järjestelmällisesti

Lisätiedot

HYÖDYKEMARKKINAT. Sisältö. Matti Estola. 5. marraskuuta 2013. 1 Erilaiset markkinatilanteet 4. 2 Miksi erilaisia markkinatilanteita esiintyy 5

HYÖDYKEMARKKINAT. Sisältö. Matti Estola. 5. marraskuuta 2013. 1 Erilaiset markkinatilanteet 4. 2 Miksi erilaisia markkinatilanteita esiintyy 5 HYÖDYKEMARKKINAT Matti Estola 5. marraskuuta 2013 Sisältö 1 Erilaiset markkinatilanteet 4 2 Miksi erilaisia markkinatilanteita esiintyy 5 3 Yritys täydellisesti kilpailluilla markkinoilla 8 3.1 Hinnan

Lisätiedot

Käytettävyystutkimuksen yksiselitteisyys

Käytettävyystutkimuksen yksiselitteisyys TEKNILLINEN KORKEAKOULU Elektroniikan, tietoliikenteen ja automaation tiedekunta Ilari Pulkkinen Käytettävyystutkimuksen yksiselitteisyys Kandidaatin työ Espoo 10.12.2008 Työn ohjaaja: Dosentti Timo Korhonen

Lisätiedot

Eriytta misen ja tasoryhmiin jaon vaikutukset nuorten matematiikan osaamiseen ja jatko-opintoihin

Eriytta misen ja tasoryhmiin jaon vaikutukset nuorten matematiikan osaamiseen ja jatko-opintoihin Eriytta misen ja tasoryhmiin jaon vaikutukset nuorten matematiikan osaamiseen ja jatko-opintoihin Pro gradu -tutkielma Timo Perälä 1869538 Matemaattisten tieteiden laitos Oulun yliopisto Syksy 2012 1 Sisällys

Lisätiedot

Paljonko verorahoilla saa?

Paljonko verorahoilla saa? Paljonko verorahoilla saa? Heikki A. Loikkanen Ilkka Susiluoto Paljonko verorahoilla saa? Kuntien peruspalvelutarjonnan kustannustehokkuuden erot ja niitä selittävät tekijät vuosina 1994 2002 K U N N

Lisätiedot

Hinnoittelu mitä se on käytännössä?

Hinnoittelu mitä se on käytännössä? Hinnoittelu mitä se on käytännössä? Harri I. Kulmala, VTT Hinnoittelun tausta Olipa kyseessä mikä tahansa myytäväksi aiottu tuote, palvelu tai niiden yhdistelmä, hinnoittelulla on myyjän näkökulmasta kaksi

Lisätiedot

Y100 kurssimateriaali

Y100 kurssimateriaali Y kurssimateriaali Syksy Jokke Häsä ja Jaakko Kortesharju Sisältö Johdanto 4 Reaaliarvoiset funktiot 5. Funktio.................................... 5. Yhdistetty funktio.............................. 7.3

Lisätiedot

Raskaan liikenteen määrän vaikutus kaksikaistaisten teiden liikenteen sujuvuuteen

Raskaan liikenteen määrän vaikutus kaksikaistaisten teiden liikenteen sujuvuuteen Sonja Lehtonen Raskaan liikenteen määrän vaikutus kaksikaistaisten teiden liikenteen Tiehallinnon sisäisiä julkaisuja 10/2009 Sonja Lehtonen Raskaan liikenteen määrän vaikutus kaksikaistaisten teiden

Lisätiedot

Tunnin pilotti Talvihoidon toimenpideajan lyhentämisen vaikutus liikenneturvallisuuteen. Tielaitos 47/2000. Tielaitoksen sisäisiä julkaisuja

Tunnin pilotti Talvihoidon toimenpideajan lyhentämisen vaikutus liikenneturvallisuuteen. Tielaitos 47/2000. Tielaitoksen sisäisiä julkaisuja Tielaitos Tunnin pilotti Talvihoidon toimenpideajan lyhentämisen vaikutus liikenneturvallisuuteen Tielaitoksen sisäisiä julkaisuja 47/2000 Helsinki 2000 TIEHALLINTO Tie- ja liikennetekniikka Tielaitoksen

Lisätiedot

Impulsseja. Onko vaalitavalla merkitystä? Henkilövaalit vai puoluelistat suhteellisissa vaalijärjestelmissä. Tammikuu 2014.

Impulsseja. Onko vaalitavalla merkitystä? Henkilövaalit vai puoluelistat suhteellisissa vaalijärjestelmissä. Tammikuu 2014. Impulsseja Tammikuu 2014 Krister Lundell Onko vaalitavalla merkitystä? Henkilövaalit vai puoluelistat suhteellisissa vaalijärjestelmissä Henkilö-, puoluelista ja sekavaalijärjestelmien välillä on eroja

Lisätiedot

2. Polynomien jakamisesta tekijöihin

2. Polynomien jakamisesta tekijöihin Imaginaariluvut mielikuvitustako Koska yhtälön x 2 x 1=0 diskriminantti on negatiivinen, ei yhtälöllä ole reaalilukuratkaisua Tästä taas seuraa, että yhtälöä vastaava paraabeli y=x 2 x 1 ei leikkaa y-akselia

Lisätiedot

Kaikki mitä olet aina halunnut tietää pumppauslemmoista, mutta mitä et ole kehdannut kysyä

Kaikki mitä olet aina halunnut tietää pumppauslemmoista, mutta mitä et ole kehdannut kysyä Kaikki mitä olet aina halunnut tietää pumppauslemmoista, mutta mitä et ole kehdannut kysyä Tommi Syrjänen 1 Yleistä pumppauslemmoista Pumppauslemmalla voidaan todistaa, että kieli ei kuulu johonkin kieliluokkaan.

Lisätiedot

Markkinoiden toimivuudesta 1

Markkinoiden toimivuudesta 1 Kansantaloudellinen aikakauskirja 97. vsk. 1/2001 Markkinoiden toimivuudesta 1 KATSAUKSIA JA KESKUSTELUA Klaus Kultti Professori Helsingin kauppakorkeakoulu 1 Virkaanastujaisesitelmä Helsingin yliopistossa

Lisätiedot

WORD- ja EXCEL-opas Office 2010

WORD- ja EXCEL-opas Office 2010 Aalto Yliopiston Teknillinen Korkeakoulu Kemian ja materiaalitieteiden tiedekunta Kemian laitos Fysikaalisen kemian ja sähkökemian tutkimusryhmä WORD- ja EXCEL-opas Office 2010 Annukka Aarnio asantasa@cc.hut.fi

Lisätiedot

Lukiotason matematiikan tietosanakirja

Lukiotason matematiikan tietosanakirja niinkuin matematiikka Simo K. Kivelä Lukiotason matematiikan tietosanakirja Versio 1.12 / 10.08.2000 Simo K. Kivelä Riikka Nurmiainen TKK 1998 2005 Taustat 1/1 Lukiotason matematiikan tietosanakirja M

Lisätiedot

KASVILLISUUDEN SEKÄ MAAPERÄN LUOKITTELU JA ANALYSOINTI HYPERSPEKTRIKUVILTA

KASVILLISUUDEN SEKÄ MAAPERÄN LUOKITTELU JA ANALYSOINTI HYPERSPEKTRIKUVILTA TEKNILLINEN KORKEAKOULU Maanmittausosasto KASVILLISUUDEN SEKÄ MAAPERÄN LUOKITTELU JA ANALYSOINTI HYPERSPEKTRIKUVILTA Teknillisen korkeakoulun Maanmittausosastolla tehty diplomityö Espoo, huhtikuu 2004

Lisätiedot