Hypoteesin testaus Alkeet



Samankaltaiset tiedostot
031021P Tilastomatematiikka (5 op) kertausta 2. vk:een

Tilastollinen aineisto Luottamusväli

031021P Tilastomatematiikka (5 op) kertausta 2. vk:een

Testejä suhdeasteikollisille muuttujille

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1

Sovellettu todennäköisyyslaskenta B

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B

031021P Tilastomatematiikka (5 op) viikko 5

Testit järjestysasteikollisille muuttujille

Mat Tilastollisen analyysin perusteet, kevät 2007

Satunnaismuuttujien mittausasteikot 93

Testit laatueroasteikollisille muuttujille

Valitaan testisuure, jonka jakauma tunnetaan H 0 :n ollessa tosi.

Johdatus tilastotieteeseen Testit järjestysasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu

Väliestimointi (jatkoa) Heliövaara 1

Tilastollisen analyysin perusteet Luento 5: Jakaumaoletuksien. testaaminen

Tutkimusongelmia ja tilastollisia hypoteeseja: Perunalastupussien keskimääräinen paino? Nollahypoteesi Vaihtoehtoinen hypoteesi (yksisuuntainen)

Mat Sovellettu todennäköisyyslasku A

ABHELSINKI UNIVERSITY OF TECHNOLOGY

Sovellettu todennäköisyyslaskenta B

Mat Tilastollisen analyysin perusteet, kevät 2007

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu

MTTTP5, luento Otossuureita ja niiden jakaumia (jatkuu)

Harjoitus 7: NCSS - Tilastollinen analyysi

1. Nollahypoteesi on, että teksti on kirjoitettu lyhyemmällä murteella. Mahdollisiavaihtoehtojaonvainyksieliettäteksti

Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170

Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

10. laskuharjoituskierros, vko 14, ratkaisut

χ = Mat Sovellettu todennäköisyyslasku 11. harjoitukset/ratkaisut

Osa 2: Otokset, otosjakaumat ja estimointi

Tilastollisen analyysin perusteet Luento 4: Testi suhteelliselle osuudelle

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi. Viikko 5

Otoskoko 107 kpl. a) 27 b) 2654

806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy (1 α) = 99 1 α = 0.

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen., jos otoskeskiarvo on suurempi kuin 13,96. Mikä on testissä käytetty α:n arvo?

Sovellettu todennäköisyyslaskenta B

Todennäköisyyden ominaisuuksia

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

ARVIOINTIPERIAATTEET

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2005) 1

Luento JOHDANTO

HAVAITUT JA ODOTETUT FREKVENSSIT

r = n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit.

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

2. Keskiarvojen vartailua

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

Johdatus tilastotieteeseen Yhteensopivuuden, homogeenisuuden ja riippumattomuuden testaaminen. TKK (c) Ilkka Mellin (2004) 1

Geenikartoitusmenetelmät. Kytkentäanalyysin teoriaa. Suurimman uskottavuuden menetelmä ML (maximum likelihood) Uskottavuusfunktio: koko aineisto

11. laskuharjoituskierros, vko 15, ratkaisut

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Kaksisuuntainen varianssianalyysi. Vilkkumaa / Kuusinen 1

Tilastotieteen kertaus. Kuusinen/Heliövaara 1

n = 100 x = %:n luottamusväli µ:lle Vastaus:

031021P Tilastomatematiikka (5 op) viikko 4

Sovellettu todennäköisyyslaskenta B

/1. MTTTP1, luento Normaalijakauma (jatkoa) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti:

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Luennot, osa II

Tilastollinen päättely. 5. Väliestimointi Johdanto Luottamusvälien konstruointi Luottamusvälien vertailu

Yhteensopivuuden, homogeenisuuden ja riippumattomuuden testaaminen

Kaksisuuntainen varianssianalyysi. Heliövaara 1

Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus KE (2014) 1

Mat Sovellettu todennäköisyyslasku 5. harjoitukset/ratkaisut. Jatkuvat jakaumat

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

tilastotieteen kertaus

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

Estimointi populaation tuntemattoman parametrin arviointia otossuureen avulla Otossuure satunnaisotoksen avulla määritelty funktio

7.4 Normaalijakauma (kertausta ja täydennystä) Taulukosta P(Z 1,6449) = 0,05, P(Z -1,6449) = 0,05 P(Z 1,96) = 0,025, P(Z -1,96) = 0,025

Otoskeskiarvo on otossuure, jonka todennäköisyysjakauma tiedetään. Se on normaalijakauma, havainnollistaminen simuloiden

Johdatus tilastotieteeseen Tilastolliset testit. TKK (c) Ilkka Mellin (2005) 1

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin

c) A = pariton, B = ainakin 4. Nyt = silmäluku on5 Koska esim. P( P(A) P(B) =, eivät tapahtumat A ja B ole riippumattomia.

χ 2 -yhteensopivuustestissä käytetään χ 2 -testisuuretta χ = Mat Sovellettu todennäköisyyslasku A

Sovellettu todennäköisyyslaskenta B

Gripenberg. MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Tentti ja välikoeuusinta

POPULAATIO. Oikeastaan arvot, joista ollaan kiinnostuneita (mitatut numeeriset suureet, luokittelut).

Tutkimustiedonhallinnan peruskurssi

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Sisällysluettelo ESIPUHE KIRJAN 1. PAINOKSEEN...3 ESIPUHE KIRJAN 2. PAINOKSEEN...3 SISÄLLYSLUETTELO...4

TILASTOMATEMATIIKKA. Keijo Ruohonen

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Estimointi. Vilkkumaa / Kuusinen 1

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Johdatus varianssianalyysiin. Vilkkumaa / Kuusinen 1

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Tilastollinen testaaminen tai Tilastollinen päättely. Geneettinen analyysi

Transkriptio:

Hypoteesin testaus Alkeet Keijo Ruotsalainen Oulun yliopisto, Teknillinen tiedekunta Matematiikan jaos

Johdanto Kokeellinen tutkimus: Varmennetaan teoreettista olettamusta fysikaalisen systeemin käyttäytymisestä (parametrin arvojen suuruudesta tai minkälaista jakaumaa jokin suure noudattaa) Positivistinen tieteenteon lähtökohta: Tutkittavasta asiasta tehdään hypoteesi ( olettamus), joka hyväksytään tai hylätään kokeellisen aineiston perusteella.

Johdanto Tutkittavasta asiasta tehdään nollahypoteesi H 0 vastahypoteesi H 1 Havaintoaineistolla pyritään varmentamaan/hylkäämään nollahypoteesi Satunnaisuus: hypoteesi voidaan hyväksyä vain jollakin todennäköisyydellä "Nollahypoteesi on totta riskitasolla α"

Parametrien testaus. Satunnaismuuttuja X, parametri θ Ψ 0 on parametrin θ arvojoukon osajoukko Nollahypoteesi H 0 : θ Ψ 0, Vastahypoteesi H 1 : θ Ψ 1 = Ψ 0, Ψ 1 nollahypoteesin arvojoukon komplementti parametriavaruudessa.

Parametrien testaus Havaintoaineisto (l. satunnaisotos): {x 1,...,x n } Testimuuttujan Z arvo z(x 1,...,x n ; Ψ 0 ). Testimuuttujan todennäköisyysjakauma P Z Todennäköisyysjakaumasta kynnysarvo r 0 (tai kynnysarvot - kaksisuuntaisessa testissä) P Z (Z r 0 ) 1 α, (tai P( Z r 0 ) 1 α). Nollahypoteesin hyväksymisalue z(x 1,...,x n ; Ψ 0 ) r 0 Muussa tapauksessa nollahypoteesi

Z-testi Testimuuttuja Z N(0, 1) N(0, 1)-jakauman taulukosta kynnysarvo r 0 Riskitaso α Satunnaismuuttujan X N(µ,σ 2 ) odotusarvon µ testaus, missä keskihajonta σ on tunnettu. X = 1 n n i=1 ; X, X i N(µ,σ 2 ) ovat riippumattomia satunnaismuuttujia. Kaksi- vai yksisuuntainen testi?

Odotusarvon testi: yksisuuntainen Hypoteesit H 0 : µ µ 0 H 1 : µ > µ 0 Havaintoaineisto {x 1,...,x n }; α riskitaso; Testimuuttuja: Z = X µ 0 σ N(0, 1); n Kynnysarvo r 0 : P(Z r 0 ) = Φ(r 0 ) = 1 α, Nollahypoteesin hyväksymisalue: z = x µ 0 σ/ n r 0. Muussa tapauksessa nollahypoteesi hylätään ja valitaan vastahypoteesi.

Esimerkki Pohdi, miten kynnysarvo pitää valita, jos nollahypoteesi on riskitasolla α. H 0 : µ µ 0

Odotusarvon testi: kaksisuuntainen Hypoteesit { H 0 : µ = µ 0 H 1 : µ µ 0 Kynnysarvo r 0 : Testisuure z = x µ 0 σ/ n P( Z r 0 ) = 1 α. Hyväksymisalue x µ 0 σ/ n r 0.

%-osuuden testi Satunnaismuuttujan X Bin(n, p) parametrin estimaattori p = 1 p(1 p) X N(p, ) (asymptoottisesti). n n Parametrin estimaatti: ˆp = m n H 0 : ˆp p 0 Hypoteesit H 1 : ˆp > p 0. Testisuure z = ˆp p 0 q p0 (1 p 0 ) n N(0, 1). Kynnysarvo r 0 : Φ(r 0 ) = 1 α. Hyväksymisalue: {z r 0 }

T-testi Kun hajonta σ ei ole tunnettu. X noudattaa normaalijakaumaa X N(µ,σ 2 ) Parametrien estimaatit ovat n Otoskeskiarvo: x = 1. n i=1 Otoskeskihajonta: s 2 = 1 n 1 H 0 : µ µ 0 Hypoteesit H 1 : µ > µ 0 n [x i x] 2. i=1 Testimuuttuja z = x µ 0 s n t n 1.

T-testi Hyväksymisalueen kynnysarvo luetaan t-jakauman taulukosta riskitasolla α: P(t n 1 r 0 ) = 1 α. Nollahypoteesi hyväksytään, jos testisuure z r 0. Huomaa, että jos nollahypoteesissa epäyhtälö toisinpäin, niin kynnysarvo (r 0 < 0) pitää valita siten, että P(t n 1 r 0 ) = 1 α.

H 0 : σ σ 0 H 1 : σ > σ 0. Hajonnan testi Kun X N(µ,σ 2 ) Satunnaisotos {x 1,x 2,...,x n } X:stä Tällöin testimuuttuja noudattaa χ 2 -jakaumaa: (n 1)s 2 σ 2 χ 2 n 1. Vapausasteita n 1 Tutkittavat hypoteesit ovat tyypillisesti muotoa

Hajonnan testi Kynnysarvo r 0 riskitasolla α: P(χ 2 n 1 r 0 ) = 1 α. Testimuuttujan hyväksymisalue (n 1)s2 σ 2 0 = np (x i x) 2 i=1 σ 2 0 r 0, Muussa tapauksessa H 0 hylätään. Esimerkiksi jos riskitasoksi valitaan 5 %:a ja otoskoko n = 10, niin testimuuttuja noudattaa χ 2 9-jakaumaa 9:llä vapausasteella. Tällöin valitaan kynnystasoksi r 0 siten, että P(χ 2 9 r 0 ) = 0.95 r 0 = 16.919.

Odotusarvojen erotuksen testi X N(µ 1,σ1) 2 ja Y N(µ 2,σ 2 ) { H 0 : µ 1 = µ 2 Tehdään hypoteesit H 1 : µ 1 µ 2 Satunnaisotokset {x 1,x 2,...,x n } ja {y 1,y 2,...,y m }. Otostunnusluvut x = 1 n x i, s 2 1 = 1 n n 1 i=1 1 m 2 1 n [x i x] 2 i=1 m 2

Odotusarvojen erotustesti Odotusarvojen erotuksen estimaattori X Y N(µ 1 µ 2, σ2 1 n + σ2 2 m ). Testimuuttuja z = x y r σ 2 1 n + σ2 2 m N(0, 1) Kaksisuuntaisen testin kynnysarvo r 0 : Φ(r 0 ) Φ( r 0 ) = 2Φ(r 0 ) 1 = 1 α Φ(r 0 ) = 1 α 2, Kun keskihajonnat ovat tuntemattomia, testimuuttujana z = 1 n + 1 m x y (n 1)s 2 1 +(m 1)s2 2 n+m 2 t n+m 2, l. se noudattaa Studentin jakaumaa

Khiin neliötestit Yhteensopivuustesti Noudattaako havaintoaineisto oletettua jakaumaa vai ei? Satunnaismuuttujasta X tehdään n toisistaan riippumatonta havaintoa {x 1,x 2,...,x n } Havainnot jaetaan luokkiin E i,i = 1, 2,...,k Havaintojen lukumäärä luokassa E i on n i (n 1 + n 2 + + n k = n). Olettamus: Satunnaismuuttujan todennäköisyysfunktio on P( ).

Yhteensopivuustesti Todennäköisyys sille, että satunnaismuuttuja on luokassa E i on p i = P(X E i ) Luokassa E i tulisi olla np i alkiota Jos oletettu jakauma ja havainnot vastaavat toisiaan tulisi olla n i np i kaikilla i = 1, 2,...,k. Havaintoaineiston ja mallin välisen hyvyyden mittariksi valitaan testimuuttuja k i=1 (n i np i ) 2 np i.

Yhteensopivuustesti Nyt voidaan osoittaa, että testimuuttuja noudattaa likimain χ 2 k 1-jakaumaa, jos seuraavat ehdot ovat voimassa: havaintoaineiston koko on kyllin suuri: n 50; Jokainen luvuista np i 2; Korkeintaan 20 % luvuista np i 5. Muussa tapauksessa yhdistä luokkia.

Testin suorittaminen Asetettavat hypoteesit ovat H 0 : Havaintoaineisto noudattaa oletusjakaumaa; H 1 : havaintoaineisto ei noudata oletusjakaumaa. Valitaan riskitaso α Luetaan χ 2 k 1-jakauman taulukosta kynnysarvo r 0 : P(χ 2 k 1 r 0) = 1 α. Nollahypoteesi kelpuutetaan, jos k (ni np i ) 2 r 0.

Huomioita Usein satunnaismuuttujan oletusjakauma sisältää tuntemattomia parametreja, jotka on ensin estimoitava havaintoaineistosta. Jos estimoitavien parametrien lukumäärä on l, niin silloin testimuuttuja k i=1 (n i nˆp i ) 2 nˆp i χ 2 k l 1 missä ˆp i = ˆP(X E i ) on estimoitu luokkatodennäköisyys.

Riippumattomuustesti Satunnaismuuttuja X; Havaintoaineisto {x 1,x 2,...,x n } Aineisto luokitellaan kahdella eri tavalla luokkiin A-tapa: luokat A 1,A 2,...,A k ; B-tapa: luokat B 1,B 2,...,B l. Tutkitaan, ovatko luokittelut riippumattomat

Riippumattomuustesti Havainnoista muodostetaan lukumäärätaulukko l. kontingenssitaulukko: A\B B 1 B 2 B 3 B l rivisumm A 1 n 11 n 12 n 13 n 1k l j=1 n 1j = A 2 n 21 n 22 n 23 n 2k l j=1 n 2j = A 3 n 31 n 32 n 33 n 3k l j=1 n 3j =...... A k n k1 n k2 n k3 n l kk j=1 n kj = sarakesummat n 1 n 2 n 3 n l i,j n ij =

Riippumattomuustesti Merkitään P( Havainto luokasta A i ) = p i P( Havainto luokasta B j ) = q j P( Havainto luokasta A i B j ) = t ij Jos luokittelut ovat riippumattomat, niin tulisi olla t ij = p i q j Epävarmuus päätöksenteossa: riskitaso α. Luokan A i havaintojen suhteellinen osuus ˆp i = m i n Luokan B j havaintojen suhteellinen osuus. ˆq j = n j n

Riippumattomuustesti Testimuuttuja k i=1 l j=1 (n ij nˆp iˆq j ) 2 nˆp iˆq j χ 2 (k 1)(l 1) Testimuuttujan käyttö sallittua, jos n 50, nˆp iˆq j 2, korkeintaan 20 % luvuista nˆp iˆq j on pienempiä kuin 5. Tehdään hypoteesit H 0 : Luokittelut riippumattomat H : Luokittelut riippuvat.

Hypoteesin testaus Luetaan χ 2 -jakauman taulukosta kynnysarvo r 0 siten, että P(χ 2 (k 1)(l 1) r 0) = 1 α. Jos testimuuttujan arvo k i=1 l j=1 (n ij nˆp iˆq j ) 2 nˆp iˆq j r 0, niin luokittelut ovat riippumattomia.