Odotusarvoparien vertailu. Vilkkumaa / Kuusinen 1

Samankaltaiset tiedostot
Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1

Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1

Johdatus varianssianalyysiin. Vilkkumaa / Kuusinen 1

Kaksisuuntainen varianssianalyysi. Vilkkumaa / Kuusinen 1

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

Harjoitus 7: NCSS - Tilastollinen analyysi

Väliestimointi (jatkoa) Heliövaara 1

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin

Kaksisuuntainen varianssianalyysi. Heliövaara 1

ABHELSINKI UNIVERSITY OF TECHNOLOGY

Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2005) 1

Sovellettu todennäköisyyslaskenta B

Regressioanalyysi. Vilkkumaa / Kuusinen 1

Lohkoasetelmat. Vilkkumaa / Kuusinen 1

Mat Tilastollisen analyysin perusteet, kevät 2007

Kertausluento. Vilkkumaa / Kuusinen 1

Estimointi. Vilkkumaa / Kuusinen 1

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

Sovellettu todennäköisyyslaskenta B

Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus KE (2014) 1

Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt: Mitä opimme? Latinalaiset neliöt

Todennäköisyyden ominaisuuksia

Mat Tilastollisen analyysin perusteet, kevät 2007

Testejä suhdeasteikollisille muuttujille

10. laskuharjoituskierros, vko 14, ratkaisut

Sovellettu todennäköisyyslaskenta B

Lohkoasetelmat. Heliövaara 1

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi. Viikko 5

Tilastollisen analyysin perusteet Luento 11: Epäparametrinen vastine ANOVAlle

Sovellettu todennäköisyyslaskenta B

Mat Sovellettu todennäköisyyslasku A

Tilastolliset testit. Tilastolliset testit. Tilastolliset testit: Mitä opimme? 2/5. Tilastolliset testit: Mitä opimme? 1/5

1. YKSISUUNTAINEN VARIANSSIANALYYSI: AINEISTON ESITYSMUODOT

Sovellettu todennäköisyyslaskenta B

031021P Tilastomatematiikka (5 op) viikko 5

¼ ¼ joten tulokset ovat muuttuneet ja nimenomaan huontontuneet eivätkä tulleet paremmiksi.

Jos nyt on saatu havaintoarvot Ü ½ Ü Ò niin suurimman uskottavuuden

Johdatus tilastotieteeseen Tilastolliset testit. TKK (c) Ilkka Mellin (2005) 1

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

5.7 Uskottavuusfunktioon perustuvia testejä II

Vastepintamenetelmä. Vilkkumaa / Kuusinen 1

Testit laatueroasteikollisille muuttujille

Jos nollahypoteesi pitää paikkansa on F-testisuuren jakautunut Fisherin F-jakauman mukaan

Tilastollisen analyysin perusteet Luento 6: Korrelaatio ja riippuvuus tilastotieteessä

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Lohkoasetelmat. Kuusinen/Heliövaara 1

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170

2. TILASTOLLINEN TESTAAMINEN...

Sovellettu todennäköisyyslaskenta B

POPULAATIO. Oikeastaan arvot, joista ollaan kiinnostuneita (mitatut numeeriset suureet, luokittelut).

Gripenberg. MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Tentti ja välikoeuusinta

MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op)

Todennäköisyyslaskun kertaus. Vilkkumaa / Kuusinen 1

Vastepintamenetelmä. Kuusinen/Heliövaara 1

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu

Testaa onko myrkkypitoisuus eri ryhmissä sama. RATK. Lasketaan kaikkien havaintoarvojen summa: k T i = = 486.

Mat Tilastollisen analyysin perusteet, kevät 2007

806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy (1 α) = 99 1 α = 0.

Regressioanalyysi. Kuusinen/Heliövaara 1

Tutkimusongelmia ja tilastollisia hypoteeseja: Perunalastupussien keskimääräinen paino? Nollahypoteesi Vaihtoehtoinen hypoteesi (yksisuuntainen)

Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen., jos otoskeskiarvo on suurempi kuin 13,96. Mikä on testissä käytetty α:n arvo?

edellyttää valintaa takaisinpanolla Aritmeettinen keskiarvo Jos, ½ Ò muodostavat satunnaisotoksen :n jakaumasta niin Otosvarianssi Ë ¾

Yhden selittäjän lineaarinen regressiomalli (jatkoa) Ensi viikolla ei pidetä luentoa eikä harjoituksia. Heliövaara 1

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu

Tilastollisia peruskäsitteitä ja Monte Carlo

Tilastollinen aineisto Luottamusväli

Tilastollisen analyysin perusteet Luento 4: Testi suhteelliselle osuudelle

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MTTTP5, luento Otossuureita ja niiden jakaumia (jatkuu)

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

Tilastollinen päättömyys, kevät 2017 Harjoitus 6B

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 6. luento. Pertti Palo

MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op)

MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op)

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Tilastotieteen kertaus. Kuusinen/Heliövaara 1

11. laskuharjoituskierros, vko 15, ratkaisut

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Luennot, osa II

Testit järjestysasteikollisille muuttujille

Valitaan testisuure, jonka jakauma tunnetaan H 0 :n ollessa tosi.

χ = Mat Sovellettu todennäköisyyslasku 11. harjoitukset/ratkaisut

1. Tutkitaan tavallista kahden selittäjän regressiomallia

Mat Tilastollisen analyysin perusteet, kevät 2007

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

Osa 2: Otokset, otosjakaumat ja estimointi

Estimointi. Otantajakauma

Estimointi. Luottamusvälin laskeminen keskiarvolle α/2 α/2 0.1

5 Hypoteesien testaaminen

Mat Tilastollisen analyysin perusteet, kevät 2007

Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit

tilastotieteen kertaus

Sovellettu todennäköisyyslaskenta B

Transkriptio:

Odotusarvoparien vertailu Vilkkumaa / Kuusinen 1

Motivointi Viime luennolta: yksisuuntaisella varianssianalyysilla testataan nollahypoteesia H 0 : μ 1 = μ 2 = = μ k = μ Jos H 0 hylätään, tiedetään, että ainakin kaksi odotusarvoista μ i, i = 1, 2,..., k, eroaa tilastollisesti merkitsevästi toisistaan. Mutta mitkä? Kysymykseen voidaan vastata vertailemalla ryhmäkohtaisia odotusarvoja pareittain Vertailu voidaan suorittaa käyttämällä luottamusvälejä tai testejä. Vilkkumaa / Kuusinen 2

Odotusarvoparien vertailu - luottamusvälin käyttö 1/2 Oletetaan, että haluamme verrata odotusarvoja μ k ja μ l. Vertailu voidaan suorittaa siten, että konstruoidaan odotusarvojen μ k ja μ l erotukselle μ k μ l luottamusväli luottamustasolla (1 α) ja tutkitaan kuuluuko nolla väliin vai ei. Vilkkumaa / Kuusinen 3

Odotusarvoparien vertailu - luottamusvälin käyttö 2/2 Käytetään odotusarvojen μ k ja μ l erotuksen luottamusvälinä luottamustasolla (1 α) väliä (ȳ k ȳ l ) ± t α/2 s P 1 n k + 1 n l, missä s 2 P = 1 N k (n i 1)s 2 i = 1 N k on ns. yhdistetty varianssi, jossa s 2 i = 1 n i 1 i havaintojen otosvarianssi. SSE = MSE ni j=1 (y ji ȳ i ) 2 on ryhmän Vilkkumaa / Kuusinen 4

Odotusarvoparien vertailu - testauksen käyttö 1/2 Oletetaan, että haluamme verrata odotusarvoja μ k ja μ l. Vertailu tapahtuu testaamalla nollahypoteesia merkitsevyystasolla α. Vaihtoehtoisen hypoteesina on H 0 : μ k = μ l H 1 : μ k μ l Vilkkumaa / Kuusinen 5

Odotusarvoparien vertailu - testauksen käyttö 2/2 Käytetään t-testisuuretta t = ȳ k ȳ l s P 1 n k + 1 n l. Nollahypoteesin pätiessä t t(n k). Itseisarvoltaan suuret testisuureen t arvot johtavat nollahypoteesin hylkäämiseen. Vilkkumaa / Kuusinen 6

Simultaaniset testit Jos ryhmiä on k kpl, on mahdollisia parivertailuja ( ) k k(k 1) m = = 2 2 kappaletta Simultaanisessa testauksessa tarkastellaan todennäköisyyttä α, että vähintään yhden testin nollahypoteesi hylätään virheellisesti. Vilkkumaa / Kuusinen 7

Simultaaniset testit Määritellään tapahtuma A i = Nollahypoteesia ei hylätä virheellisesti testissä i, i = 1, 2,..., m. Jos kaikissa vertailutesteissä käytetään merkitsevyystasoa α, niin P (A i ) = 1 α, i = 1, 2,..., m, ja P (A c i) = α, i = 1, 2,..., m. Vilkkumaa / Kuusinen 8

Simultaaniset testit - Bonferronin epäyhtälö Olkoot tapahtumia. Tällöin pätee Bonferronin epäyhtälö A 1, A 2,..., A m P (A 1 A 2 A m ) 1 [P (A c 1) + P (A c 2) + + P (A c m)]. Vilkkumaa / Kuusinen 9

Bonferronin menetelmä simultaanisissa testeissä Bonferronin epäyhtälöstä seuraa, että α = P ( Vähintään yksi virheellinen hylkäys ) = 1 P ( Ei yhtään virheellistä hylkäystä ) = 1 P (A 1 A 2 A m ) mα, missä m on testien lukumäärä. Kun valitaan taataan, että α = β m, α β. Vilkkumaa / Kuusinen 10

Klikkeri-kysely Testataan kahdeksaa hypoteesia samanaikaisesti. Mikä merkitsevyystaso α testeissä on valittava, jotta todennäköisyys vähintään yhdelle virheelliselle hylkäykselle on alle 0.1? 1. 0.1 2. 0.05 3. 0.0125 Vilkkumaa / Kuusinen 11

Yhteenveto: parivertailut Jos yksisuuntaisen varianssianalyysin nollahypoteesi hylätään, tiedetään, että ainakin kahden ryhmän odotusarvot poikkeavat toisistaan Ryhmäkohtaisia odotusarvoja voidaan tällöin vertailla pareittain t-testillä Simultaanisia parivertailutestejä tehtäessä voidaan tarkastella todennäköisyyttä sille, että vähintään yhden testin nollahypoteesi hylätään virheellisesti Jos tämän todennäköisyyden halutaan olevan enintään β ja testejä on m kpl, tulee kunkin testin merkitsevyystasoksi valita β/m Vilkkumaa / Kuusinen 12

Kontrastit Vilkkumaa / Kuusinen 13

Motivointi Ryhmiin jaetun aineiston odotusarvoille μ i, i = 1, 2,..., k on tähän mennessä esitetty kahdenlaisia hypoteeseja: - H 0 : μ 1 = μ 2 =... = μ k = μ (varianssianalyysi) - H 0 : μ k = μ l (parivertailu) Entä jos halutaan tarkastella monimutkaisempia hypoteeseja, kuten H 0 : μ k + μ k+1 = μ l + μ l+1 tai H 0 : μ k = 1 2 (μ l + μ l+1 )? Tällaisia hypoteeseja voidaan testata käyttämällä kontrasteja. Vilkkumaa / Kuusinen 14

Kontrastin määritelmä Olkoon y ji = μ i + ε ji, j = 1, 2,..., n i, i = 1, 2,..., k yksisuuntaisen varianssianalyysin malli, jossa jäännöstermit ε ji ovat riippumattomia ja normaalijakautuneita: ε ji N(0, σ 2 ), j, i Parametrien μ 1, μ 2,..., μ k lineaarikombinaatio Γ = c i μ i on kontrasti, jos c i = 0. Vilkkumaa / Kuusinen 15

Kontrasteja koskevat hypoteesit Asetetaan kontrastille Γ nollahypoteesi ja vaihtoehtoinen hypoteesi H 0 : Γ = H 1 : Γ = c i μ i = 0 c i μ i 0 Vilkkumaa / Kuusinen 16

Kontrastien estimointi Olkoon kontrastin estimaattori. C = Γ = c i ȳ i c i μ i Estimaattori C on normaalijakautunut: C N(μ C, σc 2 ), missä μ C = E(C) = c i μ i = Γ σ 2 C = D 2 (C) = σ 2 c 2 i n i Vilkkumaa / Kuusinen 17

F -testi kontrasteille 1/3 Olkoon Q 1 = C2 D 2 (C). Jos nollahypoteesi H 0 : Γ = 0 pätee, niin Q 1 χ 2 (1). Olkoon jossa SSE = k Voidaan osoittaa, että jossa N = n 1 + n 2 + + n k. Q 2 = SSE σ, 2 ni j=1 (y ji ȳ i ) 2 = k (n i 1)s 2 i. Q 2 χ 2 (N k), Vilkkumaa / Kuusinen 18

F -testi kontrasteille 2/3 Määritellään F -testisuure F = Q 1 /1 Q 2 /(N k) = (N k)q 1 Q 2. Voidaan osoittaa, että neliösummat Q 1 ja Q 2 ovat riippumattomia. Näin ollen, jos nollahypoteesi H 0 : Γ = 0 pätee, niin F F (1, N k). Vilkkumaa / Kuusinen 19

F -testi kontrasteille 3/3 Testisuure F voidaan kirjoittaa myös muodossa F = ( ) 2 k c iȳ i ( ), k c 2 i MSE n i jossa MSE = SSE/(N k) ja SS C = ( c i ȳ i ) 2 / c 2 i n i on kontrastin C neliösumma. Vilkkumaa / Kuusinen 20

t-testi kontrasteille Edellä esitetty F -testi ja testi, jossa käytetään t-testisuuretta t = MSE k c iȳ i ( k c 2 i n i ) ovat ekvivalentteja. Jos nollahypoteesi H 0 : Γ = 0 pätee, niin t t(n k). Vilkkumaa / Kuusinen 21

Ortogonaaliset kontrastit Kontrastit ja ovat ortogonaalisia, jos Γ = Δ = c i μ i d i μ i c i d i n i = 0. Vilkkumaa / Kuusinen 22

Ortogonaaliset kontrastit ja SSG Toisistaan riippumattomien ortogonaalisien kontrastien lukumäärä on k 1, jossa k on ryhmien lukumäärä. Ortogonaaliset kontrastit dekomponoivat ryhmien välistä vaihtelua kuvaavan SSG-neliösumman (k 1) komponenttiin, joista jokaisen aste on 1. Siten ortogonaalisiin kontrasteihin liittyvät testit ovat riippumattomia. Vilkkumaa / Kuusinen 23

Klikkeri-kysely Minkä tulkinnan antaisit nollahypoteesille H 0 : μ 1 + μ 2 = μ 3 + μ 4? 1. Ryhmien 1 ja 2 odotusarvot voidaan olettaa samoiksi, kuten myös ryhmien 3 ja 4. 2. Ryhmien 1 ja 2 yhdistetty odotusarvo ei poikkea ryhmien 3 ja 4 yhdistetystä odotusarvosta. 3. Kunkin neljän ryhmän odotusarvot voi olettaa samoiksi. Vilkkumaa / Kuusinen 24

Yhteenveto: kontrastit Kontrasteilla voidaan testata parivertailuja ja varianssianalyysia monimutkaisempia, ryhmäkohtaisia odotusarvoja koskevia nollahypoteeseja, esim. H 0 : μ k + μ k+1 = μ l + μ l+1 tai H 0 : μ k = 1 2 (μ l + μ l+1 ) Kontrastien testaamiseen voidaan käyttää joko t- tai F -testiä Ortogonaalisia kontrasteja on k:n ryhmän tapauksessa k 1 kpl Ortogonaaliset kontrastit dekomponoivat ryhmien välistä vaihtelua kuvaavan SSG-neliösumman (k 1) komponenttiin, joista jokaisen aste on 1 Vilkkumaa / Kuusinen 25