Lohkoasetelmat. Heliövaara 1

Samankaltaiset tiedostot
Lohkoasetelmat. Kuusinen/Heliövaara 1

Lohkoasetelmat. Vilkkumaa / Kuusinen 1

Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt: Mitä opimme? Latinalaiset neliöt

Kaksisuuntainen varianssianalyysi. Vilkkumaa / Kuusinen 1

Kaksisuuntainen varianssianalyysi. Heliövaara 1

Koesuunnittelu Latinalaiset neliöt. TKK (c) Ilkka Mellin (2005) 1

Johdatus varianssianalyysiin. Vilkkumaa / Kuusinen 1

Vastepintamenetelmä. Heliövaara 1

Hierarkkiset koeasetelmat. Heliövaara 1

Kertausluento. Vilkkumaa / Kuusinen 1

Koesuunnittelu 2 k -faktorikokeet. TKK (c) Ilkka Mellin (2005) 1

Osafaktorikokeet. Kurssipalautetta voi antaa Oodissa Kuusinen/Heliövaara 1

Vastepintamenetelmä. Kuusinen/Heliövaara 1

Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1

2 k -faktorikokeet. Vilkkumaa / Kuusinen 1

Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1

Kaksisuuntaisen varianssianalyysin tilastollisessa malli voidaan esittää seuraavassa muodossa:

Useampisuuntainen varianssianalyysi. Useampisuuntainen varianssianalyysi. Useampisuuntainen varianssianalyysi

Altistusaika 1 kk 2 kk 3 kk

Odotusarvoparien vertailu. Vilkkumaa / Kuusinen 1

Regressioanalyysi. Vilkkumaa / Kuusinen 1

Regressioanalyysi. Kuusinen/Heliövaara 1

Yhden selittäjän lineaarinen regressiomalli (jatkoa) Ensi viikolla ei pidetä luentoa eikä harjoituksia. Heliövaara 1

Vastepintamenetelmä. Vilkkumaa / Kuusinen 1

Mat Tilastollisen analyysin perusteet, kevät 2007

Mat Tilastollisen analyysin perusteet, kevät 2007

Koesuunnittelu Vastepintamenetelmä. TKK (c) Ilkka Mellin (2005) 1

Harjoitus 7: NCSS - Tilastollinen analyysi

Johdatus regressioanalyysiin. Heliövaara 1

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin

Lohkoasetelmat. Lohkoasetelmat. Lohkoasetelmat: Mitä opimme? Lohkoasetelmat. Lohkoasetelmat. Satunnaistettu täydellinen lohkoasetelma 1/4

Väliestimointi (jatkoa) Heliövaara 1

2 2 -faktorikokeen määritelmä

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

Johdatus tilastotieteeseen Kaksisuuntainen varianssianalyysi. TKK (c) Ilkka Mellin (2005) 1

Sovellettu todennäköisyyslaskenta B

Johdatus tilastotieteeseen Yleinen lineaarinen malli. TKK (c) Ilkka Mellin (2004) 1

MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op)

ABHELSINKI UNIVERSITY OF TECHNOLOGY

Ilkka Mellin Tilastolliset menetelmät. Osa 4: Lineaarinen regressioanalyysi. Yleinen lineaarinen malli. TKK (c) Ilkka Mellin (2007) 1

MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op)

MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op)

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B

Mat Tilastollisen analyysin perusteet, kevät 2007

Jos nyt on saatu havaintoarvot Ü ½ Ü Ò niin suurimman uskottavuuden

Sovellettu todennäköisyyslaskenta B

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Mat Tilastollisen analyysin perusteet, kevät 2007

edellyttää valintaa takaisinpanolla Aritmeettinen keskiarvo Jos, ½ Ò muodostavat satunnaisotoksen :n jakaumasta niin Otosvarianssi Ë ¾

Mat Tilastollisen analyysin perusteet, kevät 2007

Tilastollisen analyysin perusteet Luento 9: Moniulotteinen lineaarinen. regressio

Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit

1. YKSISUUNTAINEN VARIANSSIANALYYSI: AINEISTON ESITYSMUODOT

Gripenberg. MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Tentti ja välikoeuusinta

Harjoitus 9: Excel - Tilastollinen analyysi

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2005) 1

Testaa onko myrkkypitoisuus eri ryhmissä sama. RATK. Lasketaan kaikkien havaintoarvojen summa: k T i = = 486.

Todennäköisyyden ominaisuuksia

Tilastollisen analyysin perusteet Luento 7: Lineaarinen regressio

Sovellettu todennäköisyyslaskenta B

1. KAKSISUUNTAINEN VARIANSSIANALYYSI: TULOSTEN TULKINTA

Testejä suhdeasteikollisille muuttujille

1. YKSISUUNTAINEN VARIANSSIANALYYSI: AINEISTON ESITYSMUODOT

Erityiskysymyksiä yleisen lineaarisen mallin soveltamisessa

Tilastollisen analyysin perusteet Luento 11: Epäparametrinen vastine ANOVAlle

Testit järjestysasteikollisille muuttujille

Toimittaja Erä

Yleinen lineaarinen malli

Osafaktorikokeet. Heliövaara 1

10. laskuharjoituskierros, vko 14, ratkaisut

ABHELSINKI UNIVERSITY OF TECHNOLOGY

Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus KE (2014) 1

3.2 Matriisien laskutoimitukset. 3.2 Matriisien laskutoimitukset. 3.2 Matriisien laskutoimitukset. 3.2 Matriisien laskutoimitukset

Koska ovat negatiiviset. Keskihajontoja ei pystytä laskemaan mutta pätee ¾.

Mat Tilastollisen analyysin perusteet, kevät 2007

Osa 2: Otokset, otosjakaumat ja estimointi

Testit laatueroasteikollisille muuttujille

Latinalaiset neliöt ja taikaneliöt

Tilastollinen aineisto Luottamusväli

VARIANSSIANALYYSI ANALYSIS OF VARIANCE

5.7 Uskottavuusfunktioon perustuvia testejä II

Korrelaatiokertoinen määrittely 165

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170

Jos nollahypoteesi pitää paikkansa on F-testisuuren jakautunut Fisherin F-jakauman mukaan

Estimointi. Vilkkumaa / Kuusinen 1

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu

11. laskuharjoituskierros, vko 15, ratkaisut

2. Teoriaharjoitukset

Sovellettu todennäköisyyslaskenta B

9.1 Hierarkiset asetelmat (Nested Designs)

Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit

Mat Dynaaminen optimointi, mallivastaukset, kierros 1

Mat Tilastollisen analyysin perusteet, kevät 2007

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

tilastotieteen kertaus

4. Satunnaistetut lohkokokeet, latinalaiset neliöt ja vastaavat asetelmat. Tavoite on eliminoida sen vaikutus koetuloksista. Eliminointimenetelmiä:

Insinöörimatematiikka D

KURSSIN TILASTOMATEMATIIKKA KAAVOJA

Transkriptio:

Lohkoasetelmat Heliövaara 1

Kiusatekijä Kaikissa kokeissa, kokeen tuloksiin voi vaikuttaa vaihtelu joka johtuu kiusatekijästä. Kiusatekijä on tekijä, jolla mahdollisesti on vaikutusta vastemuuttujan arvoon, mutta jonka vaikutuksesta ei olla kiinnostuneita. Jos kiusatekijä on tuntematon (ja hallitsematon), sen vaikutusta tuloksiin voidaan estää satunnaistuksella. Jos kuisatekijä on tunnettu ja hallittu, sen vaikutus voidaan systemaattisesti estää lohkomalla. Lohkoasetelmat on yleisnimitys koesuunnitelmille, joissa käytetään lohkomista. Tällä kurssilla käsiteltäviä lohkoasetelmia ovat satunnaistettu täydellinen lohkoasetelma ja latinalaisten neliöiden koeasetelma. Heliövaara 2

Satunnaistettu täydellinen lohkoasetelma Heliövaara 3

Satunnaistettu täydellinen lohkoasetelma (i) Oletetaan, että haluamme tutkia käsittelyn A vaikutusta vastemuuttujaan. Asetelmassa on kuitenkin mukana yksi kiusatekijä B, jonka vaikutus sekoittuu käsittelyn A vaikutukseen. Oletetaan lisäksi, että kokeen mahdollisten kohteiden joukko voidaan lohkoa, eli jakaa homogeenisiin ryhmiin tekijän B tasojen suhteen. (ii) Oletetaan, että käsittelyllä A on I tasoa ja kiusatekijällä B on J tasoa, jolloin havainnot voidaan jakaa I J ryhmään. (iii) Poimitaan jokaisesta kiusatekijän B tason määräämästä lohkosta satunnaisesti I yksilöä ja arvotaan käsittelyt ko. yksilöille. (iv) Mitataan vastemuuttujan y arvot. Heliövaara 4

Satunnaistetun täydellisen lohkoasetelman nollahypoteesi Käsittelyiden vaikutusta koskeva nollahypoteesi on muotoa H A : Ei käsittelyvaikutusta Satunnaistetun täydellisen lohkoasetelman analyysi tarkoittaa nollahypoteesin H A testaamimsta, kun asetelmassa on mukana kiusatekijä B. Heliövaara 5

Lohkoasetelman tilastollinen malli Satunnaistetun täydellisen lohkoasetelman tilastollinen malli voidaan parametroida seuraavasti: y ij = µ + α i + β j + ε ij i = 1, 2,...,I, j = 1, 2,...,J, jossa jäännöstermit ε ij ovat riippumattomia ja normaalijakautuneita. Mallin parametreja ovat vakiot µ,α i,β j sekä jäännösvarianssi σ 2. Parametrien on toteutettava ehdot: I α i = J β j = 0 i=1 j=1 Heliövaara 6

Käsittelykeskiarvot, lohkokeskiarvot ja kokonaiskeskiarvo Määritellään havaintoarvojen y ij käsittelykeskiarvot: ȳ i = 1 J J j=1 y ij, i = 1, 2,...,I Määritellään havaintoarvojen y ij lohkokeskiarvot: ȳ j = 1 I I i=1 y ij, j = 1, 2,...,J Kaikkien havaintojen kokonaiskeskiarvo on ȳ = 1 IJ I i=1 J j=1 y ij Heliövaara 7

Neliösummia 1/2 Olkoon I J SST = (y ij ȳ ) 2 i=1 j=1 havaintoarvojen y ji kokonaisvaihtelua kuvaava neliösumma, SSA = J I (ȳ i ȳ ) 2 i=1 käsittelyvaikutusta kuvaava neliösumma ja SSB = I J j=1 (ȳ j ȳ ) 2 lohkovaikutusta kuvaava neliösumma. Heliövaara 8

Neliösummia 2/2 Määritellään jäännösneliösumma SSE = I i=1 J (y ij ȳ i ȳ j + ȳ ) 2 j=1 Neliösummille pätee varianssianalyysihajotelma SST = SSA + SSB + SSE ja neliösummien vapausasteet toteuttavat yhtälön IJ 1 = (I 1) + (J 1) + (I 1)(J 1) Heliövaara 9

Testi käsittelyvaikutukselle Määritellään F A -testisuure F A = (I 1)(J 1) I 1 SSA SSE Jos nollahypoteesi H A : Ei käsittelyvaikutusta pätee, testisuure noudattaa F -jakaumaa vapausastein ((I 1), (I 1)(J 1)). Heliövaara 10

Lohkovaikutus Olkoon F B = (I 1)(J 1) J 1 SSB SSE Suureen F B suuret arvot viittaavat siihen, että lohkoihin jako on ollut perusteltua. Heliövaara 11

Varianssianalyysitaulukko Tulokset on tapana esittää varianssianalyysitaulukossa. Vaihtelun SS df M S F lähde A SSA I 1 MSA = SSA/df F A = MSA/MSE B SSB J 1 MSB = SSB/df Jäännös SSE (I 1)(J 1) MSE = SSE/df Kokonais SST IJ 1 vaihtelu Heliövaara 12

Kaksisuuntainen varianssianalyysi ja satunnaistettu täydellinen lohkoasetelma Mikäli kaksisuuntaisessa varianssianalyysissa ryhmäkohtaisien havaintojen lukumäärä K on yksi, ylittää parametrien määrä havaintojen määrän, jolloin jäännösneliösumma SSE saa arvon nolla. Tällöin emme voi määrittää myöskään testisuureita F A,F B,F AB. Kaksisuuntainen varianssianalyysi siis edellyttää, että ryhmäkohtaisten havaintojen lukumäärä K on vähintään 2. Satunnaistetussa täydellisessä lohkoasetelmassa kustakin ryhmästä otetaan yksi havainto ja yhdysvaikutus sisällytetään jäännöstekijään. Näin saadaan nollasta poikkeava jäännösvarianssin estimaattori M SE ja voidaan suorittaa testi A-vaikutukselle. Heliövaara 13

Satunnaistetun täydellisen lohkoasetelman laskutoimitusten suorittaminen Ohjeet tarvittavien laskutoimitusten suorittamiseen löytyy 9. laskuharjoituksen ratkaisuista sivuilta 23-24. Heliövaara 14

Latinalaiset neliöt Heliövaara 15

Latinalaisten neliöiden koeasetelma (i) Oletetaan, että haluamme tutkia jonkin ryhmittelevän tekijän tai käsittelyn vaikutusta vastemuuttujaan y, kun asetelmassa on mukana kaksi kiusatekijää R ja C, joiden tasojen mukaan kokeen mahdollisten kohteiden joukko voidaan lohkoa eli jakaa homogeenisiin ryhmiin. (ii) Oletetaan, että kiinnostuksen kohteena olevalla tekijällä on P tasoa ja kiusatekijöillä R ja C on myös P tasoa, jolloin havainnot voidaan lohkoa kiusatekijöiden suhteen P P = P 2 ryhmään. (iii) Poimitaan jokaisesta kiusatekijöiden R ja C tasojen määräämästä lohkosta satunnaisesti yksi yksilö kokeeseen ja arvotaan käsittelyt ko. yksilöille siten, että kiinnostuksen kohteena olevan käsittelyn tasot muodostavat ns. latinalaisen neliön. (iv) Mitataan vastemuuttujan arvot. Heliövaara 16

Latinalaiset neliöt P P matriisi on latinalainen neliö, jos sen alkioina ovat kirjaimet A,B,C,... (P kpl) ja jokainen kirjain esiintyy täsmälleen kerran matriisin jokaisella rivillä ja sarakkeella. Samankokoisia latinalaisia neliöitä on useita kappaleita. Standardineliöksi kutsutaan latinalaista neliötä, jonka ensimmäisen rivin ja ensimmäisen sarakkeen kirjaimet ovat aakkosjärjestyksessä. Heliövaara 17

Latinalaiset neliöt Esimerkkejä latinalaisista neliöistä, kun P = 2, 3, 4 : B A A B A B C B C A C A B A B D C B C A D C D B A D A C B Esimerkkimatriiseista 3 3 matriisi on standardineliö. Heliövaara 18

Satunnaistaminen Latinalaisten neliöiden koeasetelmassa satunnaistaminen voidaan tehdä niin, että kaikkien mahdollisten latinalaisten neliöiden joukosta arvotaan yksi neliö, jonka kirjaimet määräävät kuhunkin yksilöön sovellettavan käsittelyn. Heliövaara 19

Latinalaisten neliöiden koeasetelman tilastollinen malli Latinalaisten neliöiden koeasetelman tilastollinen malli voidaan parametroida seuraavasti: y ijk = µ + α i + β j + τ k + ε ijk i = 1, 2,...,P, j = 1, 2,...,P, k = 1, 2,...,P, jossa jäännöstermit ε ijk ovat riippumattomia ja normaalijakautuneita. Mallin parametreja ovat vakiot µ,α i,β j,τ k sekä jäännösvarianssi σ 2. Parametrien on toteutettava ehdot: α i = β j = τ k = 0 i=1 j=1 k=1 Heliövaara 20

Rivikeskiarvot, sarakekeskiarvot ja käsittelykeskiarvot Määritellään havaintoarvojen y ijk rivikeskiarvot ȳ i = 1 P y ijk, i = 1,...,P, j=1 k=1 sarakekeskiarvot ȳ j = 1 P y ijk, j = 1,...,P i=1 k=1 sekä käsittelykeskiarvot ȳ k = 1 P y ijk, k = 1,...,P i=1 j=1 Heliövaara 21

Koknaiskeskiarvo Kaikkien havaintojen kokonaiskeskiarvo on ȳ = 1 P 2 i=1 j=1 k=1 y ijk Heliövaara 22

Neliösummia 1/2 Olkoon SST = (y ijk ȳ ) 2 i=1 j=1 k=1 havaintoarvojen y ijk kokonaisvaihtelua kuvaava neliösumma, SSR = P (ȳ i ȳ ) 2 i=1 rivivaikutusta kuvaava neliösumma ja SSC = P j=1 (ȳ j ȳ ) 2 sarakevaikutusta kuvaava neliösumma. Heliövaara 23

Neliösummia 2/2 Määritellään lisäksi käsittelyvaikutusta kuvaava neliösumma sekä jäännösneliösumma SSA = P k=1 (ȳ k ȳ ) 2 SSE = (y ijk ȳ i ȳ j ȳ k + 2ȳ ) 2 i=1 j=1 k=1 Neliösummille pätee varianssianalyysihajotelma ja neliösummien vapausasteet toteuttavat yhtälön SST = SSR + SSC + SSA + SSE P 2 1 = (P 1) + (P 1) + (P 1) + (P 2)(P 1) Heliövaara 24

Testi käsittelyvaikutukselle Määritellään F A -testisuure F A = (P 2)(P 1) P 1 SSA SSE Jos nollahypoteesi H A : Ei käsittelyvaikutusta pätee, testisuure noudattaa F -jakaumaa vapausastein ((P 1), (P 2)(P 1)). Heliövaara 25

Rivivaikutus ja sarakevaikutus Olkoon F R = (P 2)(P 1) P 1 SSR SSE Suureen F R suuret arvot viittaavat siihen, että lohkoihin jako rivitekijän suhteen on ollut perusteltua. Olkoon F C = (P 2)(P 1) P 1 SSC SSE Suureen F C suuret arvot viittaavat siihen, että lohkoihin jako saraketekijän suhteen on ollut perusteltua. Heliövaara 26

Varianssianalyysitaulukko Tulokset on tapana esittää varianssianalyysitaulukossa. Vaihtelun SS df M S F lähde A SSA P 1 MSA = SSA/df F A = MSA/MSE R SSR P 1 MSR = SSR/df C SSC P 1 MSC = SSC/df Jäännös SSE (P 2)(P 1) MSE = SSE/df Kokonais SST P 2 1 vaihtelu Heliövaara 27

Latinalaisten neliöiden laskutoimitusten suorittaminen Ohjeet tarvittavien laskutoimitusten suorittamiseen löytyy 9. laskuharjoituksen ratkaisuista sivulta 37. Heliövaara 28