Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1

Samankaltaiset tiedostot
Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1

Odotusarvoparien vertailu. Vilkkumaa / Kuusinen 1

Johdatus varianssianalyysiin. Vilkkumaa / Kuusinen 1

Väliestimointi (jatkoa) Heliövaara 1

Harjoitus 7: NCSS - Tilastollinen analyysi

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Kaksisuuntainen varianssianalyysi. Vilkkumaa / Kuusinen 1

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin

ABHELSINKI UNIVERSITY OF TECHNOLOGY

Kaksisuuntainen varianssianalyysi. Heliövaara 1

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2005) 1

Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit

Sovellettu todennäköisyyslaskenta B

Mat Tilastollisen analyysin perusteet, kevät 2007

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

Sovellettu todennäköisyyslaskenta B

Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt: Mitä opimme? Latinalaiset neliöt

Mat Tilastollisen analyysin perusteet, kevät 2007

Regressioanalyysi. Vilkkumaa / Kuusinen 1

Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus KE (2014) 1

Kertausluento. Vilkkumaa / Kuusinen 1

Testejä suhdeasteikollisille muuttujille

10. laskuharjoituskierros, vko 14, ratkaisut

Sovellettu todennäköisyyslaskenta B

Lohkoasetelmat. Vilkkumaa / Kuusinen 1

Lohkoasetelmat. Kuusinen/Heliövaara 1

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi. Viikko 5

Tilastolliset testit. Tilastolliset testit. Tilastolliset testit: Mitä opimme? 2/5. Tilastolliset testit: Mitä opimme? 1/5

Todennäköisyyden ominaisuuksia

Sovellettu todennäköisyyslaskenta B

1. YKSISUUNTAINEN VARIANSSIANALYYSI: AINEISTON ESITYSMUODOT

Johdatus tilastotieteeseen Tilastolliset testit. TKK (c) Ilkka Mellin (2005) 1

Lohkoasetelmat. Heliövaara 1

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Sovellettu todennäköisyyslaskenta B

Vastepintamenetelmä. Kuusinen/Heliövaara 1

031021P Tilastomatematiikka (5 op) viikko 5

Mat Sovellettu todennäköisyyslasku A

Testit laatueroasteikollisille muuttujille

Tilastollisen analyysin perusteet Luento 11: Epäparametrinen vastine ANOVAlle

MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op)

Regressioanalyysi. Kuusinen/Heliövaara 1

5.7 Uskottavuusfunktioon perustuvia testejä II

¼ ¼ joten tulokset ovat muuttuneet ja nimenomaan huontontuneet eivätkä tulleet paremmiksi.

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Jos nyt on saatu havaintoarvot Ü ½ Ü Ò niin suurimman uskottavuuden

Estimointi. Vilkkumaa / Kuusinen 1

Tutkimusongelmia ja tilastollisia hypoteeseja: Perunalastupussien keskimääräinen paino? Nollahypoteesi Vaihtoehtoinen hypoteesi (yksisuuntainen)

Tilastotieteen kertaus. Kuusinen/Heliövaara 1

Tilastollisen analyysin perusteet Luento 6: Korrelaatio ja riippuvuus tilastotieteessä

Gripenberg. MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Tentti ja välikoeuusinta

Testaa onko myrkkypitoisuus eri ryhmissä sama. RATK. Lasketaan kaikkien havaintoarvojen summa: k T i = = 486.

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1

edellyttää valintaa takaisinpanolla Aritmeettinen keskiarvo Jos, ½ Ò muodostavat satunnaisotoksen :n jakaumasta niin Otosvarianssi Ë ¾

Mat Tilastollisen analyysin perusteet, kevät 2007

Yhden selittäjän lineaarinen regressiomalli (jatkoa) Ensi viikolla ei pidetä luentoa eikä harjoituksia. Heliövaara 1

Sovellettu todennäköisyyslaskenta B

Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen., jos otoskeskiarvo on suurempi kuin 13,96. Mikä on testissä käytetty α:n arvo?

POPULAATIO. Oikeastaan arvot, joista ollaan kiinnostuneita (mitatut numeeriset suureet, luokittelut).

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170

Jos nollahypoteesi pitää paikkansa on F-testisuuren jakautunut Fisherin F-jakauman mukaan

Tilastollinen aineisto Luottamusväli

2. TILASTOLLINEN TESTAAMINEN...

Vastepintamenetelmä. Vilkkumaa / Kuusinen 1

Tilastollisen analyysin perusteet Luento 4: Testi suhteelliselle osuudelle

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Luennot, osa II

Korrelaatiokertoinen määrittely 165

806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy (1 α) = 99 1 α = 0.

Estimointi. Otantajakauma

Tilastollisia peruskäsitteitä ja Monte Carlo

2. Keskiarvojen vartailua

Testit järjestysasteikollisille muuttujille

Estimointi. Luottamusvälin laskeminen keskiarvolle α/2 α/2 0.1

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

Tilastollinen päättömyys, kevät 2017 Harjoitus 6B

χ = Mat Sovellettu todennäköisyyslasku 11. harjoitukset/ratkaisut

Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit

1. YKSISUUNTAINEN VARIANSSIANALYYSI: AINEISTON ESITYSMUODOT

1. Tutkitaan tavallista kahden selittäjän regressiomallia

MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op)

Sovellettu todennäköisyyslaskenta B

MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op)

tilastotieteen kertaus

Useampisuuntainen varianssianalyysi. Useampisuuntainen varianssianalyysi. Useampisuuntainen varianssianalyysi

Valitaan testisuure, jonka jakauma tunnetaan H 0 :n ollessa tosi.

Osa 2: Otokset, otosjakaumat ja estimointi

Vastepintamenetelmä. Heliövaara 1

11. laskuharjoituskierros, vko 15, ratkaisut

5 Hypoteesien testaaminen

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Testit suhdeasteikollisille muuttujille. Testit suhdeasteikollisille muuttujille. Testit suhdeasteikollisille muuttujille: Esitiedot

Transkriptio:

Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1

Odotusarvoparien vertailu Jos yksisuuntaisen varianssianalyysin nollahypoteesi H 0 : µ 1 = µ 2 = = µ k = µ hylätään, tiedetään, että ainakin kaksi odotusarvoista µ i, i = 1, 2,..., k, eroaa tilastollisesti merkitsevästi toisistaan. Jos nollahypoteesi H 0 hylätään, varianssianalyysia voidaan jatkaa ryhmittelyllä, jossa selvitetään missä ryhmissä odotusarvojen erot ovat tilastollisesti merkitseviä. Vertailu voidaan suorittaa käyttämällä luottamusvälejä tai testejä. Tehtävien parivertailujen lukumäärä on ( ) k 2 = k(k 1) 2 Kuusinen/Heliövaara 2

Odotusarvoparien vertailu - luottamusvälin käyttö 1/2 Oletetaan, että haluamme verrata odotusarvoja µ k ja µ l. Vertailu voidaan suorittaa siten, että konstruoidaan odotusarvojen µ k ja µ l erotukselle µ k µ l luottamusväli luottamustasolla (1 α) ja tutkitaan kuuluuko nolla väliin vai ei. Kuusinen/Heliövaara 3

Odotusarvoparien vertailu - luottamusvälin käyttö 2/2 Käytetään odotusarvojen µ k ja µ l erotuksen luottamusvälinä luottamustasolla (1 α) väliä (ȳ k ȳ l ) ± t α/2 s P 1 n k + 1 n l, missä s 2 P = 1 N k (n i 1)s 2 i = 1 N k on ns. yhdistetty varianssi, jossa s 2 i = 1 N k i havaintojen otosvarianssi. SSE = MSE ni j=1 (y ji ȳ i ) 2 on ryhmän Kuusinen/Heliövaara 4

Odotusarvoparien vertailu - testauksen käyttö 1/2 Oletetaan, että haluamme verrata odotusarvoja µ k ja µ l. Vertailu tapahtuu testaamalla nollahypoteesia merkitsevyystasolla α. Vaihtoehtoisen hypoteesina on H 0 : µ k = µ l H 1 : µ k µ l Kuusinen/Heliövaara 5

Odotusarvoparien vertailu - testauksen käyttö 2/2 Käytetään t-testisuuretta t = ȳ k ȳ l s P 1 n k + 1 n l. Nollahypoteesin pätiessä t t(n k). Itseisarvoltaan suuret testisuureen t arvot johtavat nollahypoteesin hylkäämiseen. Kuusinen/Heliövaara 6

Simultaaniset testit - Bonferronin epäyhtälö Olkoot tapahtumia. Tällöin pätee Bonferronin epäyhtälö A 1, A 2,..., A m P (A 1 A 2 A m ) 1 [P (A c 1) + P (A c 2) + + P (A c m)]. Kuusinen/Heliövaara 7

Bonferronin menetelmä simultaanisissa testeissä 1/2 Oletetaan, että tehtävänä on suorittaa m tilastollista testiä. Simultaanisessa testauksessa tarkastellaan todennäköisyyttä α, että vähintään yhden testin nollahypoteesi hylätään virheellisesti. Määritellään tapahtuma A i = Nollahypoteesia ei hylätä virheellisesti testissä i, i = 1, 2,..., m. Jos kaikissa vertailutesteissä käytetään merkitsevyystasoa α, niin P (A i ) = 1 α, i = 1, 2,..., m, ja P (A c i) = α, i = 1, 2,..., m. Kuusinen/Heliövaara 8

Bonferronin menetelmä simultaanisissa testeissä 2/2 Bonferronin epäyhtälöstä seuraa, että α = P ( Vähintään yksi virheellinen hylkäys ) = 1 P ( Ei yhtään virheellistä hylkäystä ) = 1 P (A 1 A 2 A m ) mα, missä m on testien lukumäärä. Kun valitaan taataan, että α = β m, α β. Kuusinen/Heliövaara 9

Kontrastit Kuusinen/Heliövaara 10

Kontrastit Ryhmiin jaetun aineiston odotusarvoille µ i, i = 1, 2,..., k, voidaan esittää muitakin hypoteeseja kuin varianssianalyysissa käytetty tai parivertailuissa käytetty H 0 : µ 1 = µ 2 =... = µ k = µ, H 0 : µ k = µ l. Esimerkiksi H 0 : µ k + µ k+1 = µ l + µ l+1 tai H 0 : µ k = 1 2 (µ l + µ l+1 ) Tämän muotoisia hypoteeseja voidaan testata käyttämällä kontrasteja. Kuusinen/Heliövaara 11

Kontrastin määritelmä Olkoon y ji = µ i + ε ji, j = 1, 2,..., n i, i = 1, 2,..., k yksisuuntaisen varianssianalyysin malli, jossa jäännöstermit ε ji ovat riippumattomia ja normaalijakautuneita: ε ji N(0, σ 2 ), j, i Parametrien µ 1, µ 2,..., µ k lineaarikombinaatio Γ = c i µ i on kontrasti, jos c i = 0. Kuusinen/Heliövaara 12

Kontrasteja koskevat hypoteesit Asetetaan kontrastille Γ nollahypoteesi ja vaihtoehtoinen hypoteesi H 0 : Γ = H 1 : Γ = c i µ i = 0 c i µ i 0 Kuusinen/Heliövaara 13

Kontrastien estimointi Olkoon kontrastin estimaattori. C = Γ = c i ȳ i c i µ i Estimaattori C on normaalijakautunut: C N(µ C, σc 2 ), missä µ C = E(C) = c i µ i = Γ σ 2 C = D 2 (C) = σ 2 c 2 i n i Kuusinen/Heliövaara 14

F -testi kontrasteille 1/3 Olkoon Q 1 = C2 D 2 (C). Jos nollahypoteesi H 0 : Γ = 0 pätee, niin Q 1 χ 2 (1). Olkoon jossa SSE = k Voidaan osoittaa, että jossa N = n 1 + n 2 + + n k. Q 2 = SSE σ, 2 ni j=1 (y ji ȳ i ) 2 = k (n i 1)s 2 i. Q 2 χ 2 (N k), Kuusinen/Heliövaara 15

F -testi kontrasteille 2/3 Määritellään F -testisuure F = Q 1 /1 Q 2 /(N k) = (N k)q 1 Q 2. Voidaan osoittaa, että neliösummat Q 1 ja Q 2 ovat riippumattomia. Näin ollen, jos nollahypoteesi H 0 : Γ = 0 pätee, niin F F (1, N k). Kuusinen/Heliövaara 16

F -testi kontrasteille 3/3 Testisuure F voidaan kirjoittaa myös muodossa F = ( ) 2 k c iȳ i ( ), k c 2 i MSE n i jossa MSE = SSE/(N k) ja SS C = ( c i ȳ i ) 2 / c 2 i n i on kontrastin C neliösumma. Kuusinen/Heliövaara 17

t-testi kontrasteille Edellä esitetty F -testi ja testi, jossa käytetään t-testisuuretta t = MSE k c iȳ i ( k c 2 i n i ) ovat ekvivalentteja. Jos nollahypoteesi H 0 : Γ = 0 pätee, niin t t(n k). Kuusinen/Heliövaara 18

Ortogonaaliset kontrastit Kontrastit ja ovat ortogonaalisia, jos Γ = = c i µ i d i µ i c i d i n i = 0. Kuusinen/Heliövaara 19

Ortogonaaliset kontrastit ja SSG Toisistaan riippumattomien ortogonaalisien kontrastien lukumäärä on k 1, jossa k on ryhmien lukumäärä. Ortogonaaliset kontrastit dekomponoivat ryhmien välistä vaihtelua kuvaavan SSG-neliösumman (k 1) komponenttiin, joista jokaisen aste on 1. Siten ortogonaalisiin kontrasteihin liittyvät testit ovat riippumattomia. Kuusinen/Heliövaara 20