Lohkoasetelmat. Kuusinen/Heliövaara 1

Samankaltaiset tiedostot
Lohkoasetelmat. Heliövaara 1

Lohkoasetelmat. Vilkkumaa / Kuusinen 1

Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt: Mitä opimme? Latinalaiset neliöt

Kaksisuuntainen varianssianalyysi. Vilkkumaa / Kuusinen 1

Kaksisuuntainen varianssianalyysi. Heliövaara 1

Koesuunnittelu Latinalaiset neliöt. TKK (c) Ilkka Mellin (2005) 1

Johdatus varianssianalyysiin. Vilkkumaa / Kuusinen 1

Vastepintamenetelmä. Heliövaara 1

Hierarkkiset koeasetelmat. Heliövaara 1

Kertausluento. Vilkkumaa / Kuusinen 1

Vastepintamenetelmä. Kuusinen/Heliövaara 1

Koesuunnittelu 2 k -faktorikokeet. TKK (c) Ilkka Mellin (2005) 1

Osafaktorikokeet. Kurssipalautetta voi antaa Oodissa Kuusinen/Heliövaara 1

Kaksisuuntaisen varianssianalyysin tilastollisessa malli voidaan esittää seuraavassa muodossa:

Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1

2 k -faktorikokeet. Vilkkumaa / Kuusinen 1

Useampisuuntainen varianssianalyysi. Useampisuuntainen varianssianalyysi. Useampisuuntainen varianssianalyysi

Altistusaika 1 kk 2 kk 3 kk

Regressioanalyysi. Kuusinen/Heliövaara 1

Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1

Vastepintamenetelmä. Vilkkumaa / Kuusinen 1

Regressioanalyysi. Vilkkumaa / Kuusinen 1

Odotusarvoparien vertailu. Vilkkumaa / Kuusinen 1

Mat Tilastollisen analyysin perusteet, kevät 2007

Mat Tilastollisen analyysin perusteet, kevät 2007

Lohkoasetelmat. Lohkoasetelmat. Lohkoasetelmat: Mitä opimme? Lohkoasetelmat. Lohkoasetelmat. Satunnaistettu täydellinen lohkoasetelma 1/4

Harjoitus 7: NCSS - Tilastollinen analyysi

Yhden selittäjän lineaarinen regressiomalli (jatkoa) Ensi viikolla ei pidetä luentoa eikä harjoituksia. Heliövaara 1

Koesuunnittelu Vastepintamenetelmä. TKK (c) Ilkka Mellin (2005) 1

Sovellettu todennäköisyyslaskenta B

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

Sovellettu todennäköisyyslaskenta B

Väliestimointi (jatkoa) Heliövaara 1

ABHELSINKI UNIVERSITY OF TECHNOLOGY

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin

2 2 -faktorikokeen määritelmä

Ilkka Mellin Tilastolliset menetelmät. Osa 4: Lineaarinen regressioanalyysi. Yleinen lineaarinen malli. TKK (c) Ilkka Mellin (2007) 1

Johdatus tilastotieteeseen Yleinen lineaarinen malli. TKK (c) Ilkka Mellin (2004) 1

Johdatus regressioanalyysiin. Heliövaara 1

Johdatus tilastotieteeseen Kaksisuuntainen varianssianalyysi. TKK (c) Ilkka Mellin (2005) 1

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

Sovellettu todennäköisyyslaskenta B

MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op)

MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op)

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Tilastollisen analyysin perusteet Luento 9: Moniulotteinen lineaarinen. regressio

Mat Tilastollisen analyysin perusteet, kevät 2007

Mat Tilastollisen analyysin perusteet, kevät 2007

1. YKSISUUNTAINEN VARIANSSIANALYYSI: AINEISTON ESITYSMUODOT

Sovellettu todennäköisyyslaskenta B

Todennäköisyyden ominaisuuksia

Harjoitus 9: Excel - Tilastollinen analyysi

Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2005) 1

Tilastollisen analyysin perusteet Luento 11: Epäparametrinen vastine ANOVAlle

Gripenberg. MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Tentti ja välikoeuusinta

MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op)

Jos nyt on saatu havaintoarvot Ü ½ Ü Ò niin suurimman uskottavuuden

Testit järjestysasteikollisille muuttujille

Tilastollisen analyysin perusteet Luento 7: Lineaarinen regressio

Sovellettu todennäköisyyslaskenta B

edellyttää valintaa takaisinpanolla Aritmeettinen keskiarvo Jos, ½ Ò muodostavat satunnaisotoksen :n jakaumasta niin Otosvarianssi Ë ¾

Mat Tilastollisen analyysin perusteet, kevät 2007

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170

11. laskuharjoituskierros, vko 15, ratkaisut

Testejä suhdeasteikollisille muuttujille

Testaa onko myrkkypitoisuus eri ryhmissä sama. RATK. Lasketaan kaikkien havaintoarvojen summa: k T i = = 486.

Yleinen lineaarinen malli

Erityiskysymyksiä yleisen lineaarisen mallin soveltamisessa

Testit laatueroasteikollisille muuttujille

Latinalaiset neliöt ja taikaneliöt

10. laskuharjoituskierros, vko 14, ratkaisut

1. YKSISUUNTAINEN VARIANSSIANALYYSI: AINEISTON ESITYSMUODOT

Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus KE (2014) 1

Mat Tilastollisen analyysin perusteet, kevät 2007

Osa 2: Otokset, otosjakaumat ja estimointi

Jos nollahypoteesi pitää paikkansa on F-testisuuren jakautunut Fisherin F-jakauman mukaan

Korrelaatiokertoinen määrittely 165

Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Tilastotieteen kertaus. Kuusinen/Heliövaara 1

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu

1. Tilastollinen malli??

χ = Mat Sovellettu todennäköisyyslasku 11. harjoitukset/ratkaisut

KURSSIN TILASTOMATEMATIIKKA KAAVOJA

Koska ovat negatiiviset. Keskihajontoja ei pystytä laskemaan mutta pätee ¾.

ABHELSINKI UNIVERSITY OF TECHNOLOGY

Toimittaja Erä

VARIANSSIANALYYSI ANALYSIS OF VARIANCE

Mat Tilastollisen analyysin perusteet, kevät 2007

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?

1. KAKSISUUNTAINEN VARIANSSIANALYYSI: TULOSTEN TULKINTA

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen., jos otoskeskiarvo on suurempi kuin 13,96. Mikä on testissä käytetty α:n arvo?

3.2 Matriisien laskutoimitukset. 3.2 Matriisien laskutoimitukset. 3.2 Matriisien laskutoimitukset. 3.2 Matriisien laskutoimitukset

Sovellettu todennäköisyyslaskenta B

5.7 Uskottavuusfunktioon perustuvia testejä II

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1

4. Satunnaistetut lohkokokeet, latinalaiset neliöt ja vastaavat asetelmat. Tavoite on eliminoida sen vaikutus koetuloksista. Eliminointimenetelmiä:

Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit

Estimointi. Vilkkumaa / Kuusinen 1

Transkriptio:

Lohkoasetelmat Kuusinen/Heliövaara 1

Kiusatekijä Kaikissa kokeissa kokeen tuloksiin voi vaikuttaa vaihtelu, joka johtuu kiusatekijästä. Kiusatekijä on tekijä, jolla on mahdollisesti vaikutusta vastemuuttujan arvoon, mutta jonka vaikutuksesta ei olla kiinnostuneita. Jos kiusatekijä on tuntematon (ja hallitsematon), sen vaikutusta tuloksiin voidaan estää satunnaistuksella. Jos kiusatekijä on tunnettu ja hallittu, sen vaikutus voidaan systemaattisesti estää lohkomalla. Lohkoasetelmat on yleisnimitys koesuunnitelmille, joissa käytetään lohkomista. Tällä kurssilla käsiteltäviä lohkoasetelmia ovat satunnaistettu täydellinen lohkoasetelma ja latinalaisten neliöiden koeasetelma. Kuusinen/Heliövaara 2

Satunnaistettu täydellinen lohkoasetelma Kuusinen/Heliövaara 3

Satunnaistettu täydellinen lohkoasetelma (i) Oletetaan, että haluamme tutkia käsittelyn A vaikutusta vastemuuttujaan. Asetelmassa on kuitenkin mukana yksi kiusatekijä B, jonka vaikutus saattaa sekoittua käsittelyn A vaikutukseen. Oletetaan lisäksi, että kokeen mahdollisten kohteiden joukko voidaan lohkoa, eli jakaa homogeenisiin ryhmiin tekijän B tasojen suhteen. (ii) Oletetaan, että käsittelyllä A on I tasoa ja kiusatekijällä B on J tasoa, jolloin havainnot voidaan jakaa I J ryhmään. (iii) Kohdistetaan käsittelyt tutkimuksen kohteisiin satunnaisessa järjestyksessä jokaisessa kiusatekijän B määräämässä lohkossa. (iv) Mitataan vastemuuttujan y arvot. Kuusinen/Heliövaara 4

Satunnaistetun täydellisen lohkoasetelman nollahypoteesi Käsittelyiden vaikutusta koskeva nollahypoteesi on muotoa H A : Ei käsittelyvaikutusta Satunnaistetun täydellisen lohkoasetelman analyysi tarkoittaa nollahypoteesin H A testaamista, kun asetelmassa on mukana kiusatekijä B. Kuusinen/Heliövaara 5

Lohkoasetelman tilastollinen malli Satunnaistetun täydellisen lohkoasetelman tilastollinen malli voidaan parametroida seuraavasti: y ij = µ + α i + β j + ε ij i = 1, 2,..., I, j = 1, 2,..., J, jossa jäännöstermit ε ij ovat riippumattomia ja normaalijakautuneita. Mallin parametreja ovat vakiot µ, α i, β j sekä jäännösvarianssi σ 2. Parametrien on toteutettava ehdot: I α i = J β j = 0 i=1 j=1 Kuusinen/Heliövaara 6

Käsittelykeskiarvot, lohkokeskiarvot ja kokonaiskeskiarvo Määritellään havaintoarvojen y ij käsittelykeskiarvot: ȳ i = 1 J J j=1 y ij, i = 1, 2,..., I Määritellään havaintoarvojen y ij lohkokeskiarvot: ȳ j = 1 I I i=1 y ij, j = 1, 2,..., J Kaikkien havaintojen kokonaiskeskiarvo on ȳ = 1 IJ I i=1 J j=1 y ij Kuusinen/Heliövaara 7

Neliösummia 1/2 Olkoon I J SST = (y ij ȳ ) 2 i=1 j=1 havaintoarvojen y ij kokonaisvaihtelua kuvaava neliösumma, SSA = J I (ȳ i ȳ ) 2 i=1 käsittelyvaikutusta kuvaava neliösumma ja SSB = I J j=1 (ȳ j ȳ ) 2 lohkovaikutusta kuvaava neliösumma. Kuusinen/Heliövaara 8

Neliösummia 2/2 Määritellään jäännösneliösumma: SSE = I i=1 J (y ij ȳ i ȳ j + ȳ ) 2 j=1 Neliösummille pätee varianssianalyysihajotelma SST = SSA + SSB + SSE ja neliösummien vapausasteet toteuttavat yhtälön IJ 1 = (I 1) + (J 1) + (I 1)(J 1) Kuusinen/Heliövaara 9

Testi käsittelyvaikutukselle Määritellään F A -testisuure F A = (I 1)(J 1) I 1 SSA SSE Jos nollahypoteesi H A : Ei käsittelyvaikutusta pätee, testisuure noudattaa F -jakaumaa vapausastein ((I 1), (I 1)(J 1)). Kuusinen/Heliövaara 10

Lohkovaikutus Olkoon F B = (I 1)(J 1) J 1 SSB SSE Suureen F B suuret arvot viittaavat siihen, että lohkoihin jako on ollut perusteltua. Koska satunnaistaminen suoritetaan vain lohkojen sisällä, ei testiä lohko-odotusarvojen yhtäsuuruudesta voida perustaa suureeseen F B. Kuusinen/Heliövaara 11

Varianssianalyysitaulukko Tulokset on tapana esittää varianssianalyysitaulukon muodossa: Vaihtelun SS df M S F lähde A SSA I 1 MSA = SSA/df F A = MSA/MSE B SSB J 1 MSB = SSB/df Jäännös SSE (I 1)(J 1) MSE = SSE/df Kokonais SST IJ 1 vaihtelu Kuusinen/Heliövaara 12

Kaksisuuntaisen varianssianalyysin laskutoimitusten suorittaminen Ohjeet tarvittavien laskutoimitusten suorittamiseen löytyvät 8. laskuharjoituksen ratkaisuista sivuilta 23-24. Kuusinen/Heliövaara 13

Latinalaiset neliöt Kuusinen/Heliövaara 14

Latinalaisten neliöiden koeasetelma (i) Oletetaan, että haluamme tutkia jonkin käsittelyn vaikutusta vastemuuttujaan y, josta tehtävät havainnot saattavat olla kahden kiusatekijän R ja C suhteen epähomogeenisia. (ii) Oletetaan, että kiinnostuksen kohteena olevalla käsittelyllä sekä kiusatekijöillä R ja C on P tasoa. (iii) Oletetaan, että tutkimuksen kohteet voidaan jakaa kiusatekijöiden R ja C tasojen suhteen P P = P 2 homogeeniseen ryhmään eli lohkoon. (iv) Poimitaan jokaisesta lohkosta satunnaisesti yksi yksilö kokeeseen ja arvotaan käsittelyt ko. yksilöille siten, että kiinnostuksen kohteena olevan käsittelyn tasot muodostavat ns. latinalaisen neliön. (v) Mitataan vastemuuttujan y arvot. Kuusinen/Heliövaara 15

Latinalaiset neliöt P P matriisi on latinalainen neliö, jos sen alkioina ovat kirjaimet A, B, C,... (P kpl) ja jokainen kirjain esiintyy täsmälleen kerran matriisin jokaisella rivillä ja sarakkeella. Samankokoisia latinalaisia neliöitä on useita kappaleita. Standardineliöksi kutsutaan latinalaista neliötä, jonka ensimmäisen rivin ja ensimmäisen sarakkeen kirjaimet ovat aakkosjärjestyksessä. Kuusinen/Heliövaara 16

Latinalaiset neliöt Esimerkkejä latinalaisista neliöistä, kun P = 2, 3, 4: B A A B A B C B C A C A B A B D C B C A D C D B A D A C B Esimerkkimatriiseista 3 3 matriisi on standardineliö. Kuusinen/Heliövaara 17

Satunnaistaminen Latinalaisten neliöiden koeasetelmassa satunnaistaminen voidaan tehdä niin, että kaikkien mahdollisten latinalaisten neliöiden joukosta arvotaan yksi neliö, jonka kirjaimet määräävät kuhunkin yksilöön sovellettavan käsittelyn. Kuusinen/Heliövaara 18

Latinalaisten neliöiden koeasetelman tilastollinen malli Latinalaisten neliöiden koeasetelman tilastollinen malli voidaan parametroida seuraavasti: y ijk = µ + α i + β j + τ k + ε ijk i = 1, 2,..., P, j = 1, 2,..., P, k = 1, 2,..., P, jossa jäännöstermit ε ijk ovat riippumattomia ja normaalijakautuneita. Mallin parametreja ovat vakiot µ, α i, β j, τ k sekä jäännösvarianssi σ 2. Parametrien on toteutettava ehdot: α i = β j = τ k = 0 i=1 j=1 k=1 Kuusinen/Heliövaara 19

Rivikeskiarvot, sarakekeskiarvot ja käsittelykeskiarvot Määritellään havaintoarvojen y ijk rivikeskiarvot ȳ i = 1 P y ijk, i = 1,..., P, j=1 k=1 sarakekeskiarvot ȳ j = 1 P y ijk, j = 1,..., P i=1 k=1 sekä käsittelykeskiarvot ȳ k = 1 P y ijk, k = 1,..., P i=1 j=1 Kuusinen/Heliövaara 20

Kokonaiskeskiarvo Kaikkien havaintojen kokonaiskeskiarvo on ȳ = 1 P 2 i=1 j=1 k=1 y ijk, missä P 2 on yhdistetyn otoksen havaintojen kokonaislukumäärä. Kuusinen/Heliövaara 21

Neliösummia 1/2 Olkoon SST = (y ijk ȳ ) 2 i=1 j=1 k=1 havaintoarvojen y ijk kokonaisvaihtelua kuvaava neliösumma, SSR = P (ȳ i ȳ ) 2 i=1 rivivaikutusta kuvaava neliösumma ja SSC = P j=1 (ȳ j ȳ ) 2 sarakevaikutusta kuvaava neliösumma. Kuusinen/Heliövaara 22

Neliösummia 2/2 Määritellään lisäksi käsittelyvaikutusta kuvaava neliösumma SSA = P k=1 (ȳ k ȳ ) 2 sekä jäännösneliösumma SSE = (y ijk ȳ i ȳ j ȳ k + 2ȳ ) 2 i=1 j=1 k=1 Neliösummille pätee varianssianalyysihajotelma SST = SSR + SSC + SSA + SSE ja neliösummien vapausasteet toteuttavat yhtälön P 2 1 = (P 1) + (P 1) + (P 1) + (P 2)(P 1) Kuusinen/Heliövaara 23

Testi käsittelyvaikutukselle Määritellään F A -testisuure F A = (P 2)(P 1) P 1 SSA SSE Jos nollahypoteesi H A : Ei käsittelyvaikutusta pätee, testisuure noudattaa F -jakaumaa vapausastein ((P 1), (P 2)(P 1)). Kuusinen/Heliövaara 24

Rivivaikutus ja sarakevaikutus Olkoon F R = (P 2)(P 1) P 1 SSR SSE Suureen F R suuret arvot viittaavat siihen, että lohkoihin jako rivitekijän suhteen on ollut perusteltua. Olkoon F C = (P 2)(P 1) P 1 SSC SSE Suureen F C suuret arvot viittaavat siihen, että lohkoihin jako saraketekijän suhteen on ollut perusteltua. Ei kuitenkaan ole olemassa testiä, jolla voitaisiin testata lohkomisen merkitystä. Kuusinen/Heliövaara 25

Varianssianalyysitaulukko Tulokset on tapana esittää varianssianalyysitaulukon muodossa: Vaihtelun SS df M S F lähde A SSA P 1 MSA = SSA/df F A = MSA/MSE R SSR P 1 MSR = SSR/df C SSC P 1 MSC = SSC/df Jäännös SSE (P 2)(P 1) MSE = SSE/df Kokonais SST P 2 1 vaihtelu Kuusinen/Heliövaara 26

Kaksisuuntaisen varianssianalyysin laskutoimitusten suorittaminen Ohjeet tarvittavien laskutoimitusten suorittamiseen löytyvät 8. laskuharjoituksen ratkaisuista sivulta 37. Kuusinen/Heliövaara 27