r = 0.221 n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit.



Samankaltaiset tiedostot
TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Estimointi. Otantajakauma

Testejä suhdeasteikollisille muuttujille

Väliestimointi (jatkoa) Heliövaara 1

Sovellettu todennäköisyyslaskenta B

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170

HAVAITUT JA ODOTETUT FREKVENSSIT

10. laskuharjoituskierros, vko 14, ratkaisut

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

Tutkimusongelmia ja tilastollisia hypoteeseja: Perunalastupussien keskimääräinen paino? Nollahypoteesi Vaihtoehtoinen hypoteesi (yksisuuntainen)

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1

Estimointi. Luottamusvälin laskeminen keskiarvolle α/2 α/2 0.1

Ongelma: Poikkeaako perusjoukon suhteellinen osuus vertailuarvosta?

Mat Sovellettu todennäköisyyslasku A

Sisällysluettelo ESIPUHE KIRJAN 1. PAINOKSEEN...3 ESIPUHE KIRJAN 2. PAINOKSEEN...3 SISÄLLYSLUETTELO...4

¼ ¼ joten tulokset ovat muuttuneet ja nimenomaan huontontuneet eivätkä tulleet paremmiksi.

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu

ABHELSINKI UNIVERSITY OF TECHNOLOGY

Sovellettu todennäköisyyslaskenta B

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu

Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit

Valitaan testisuure, jonka jakauma tunnetaan H 0 :n ollessa tosi.

Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen., jos otoskeskiarvo on suurempi kuin 13,96. Mikä on testissä käytetty α:n arvo?

RISKITASO. Riskitaso (α) määrittää virhepäätelmän todennäköisyyden. Käytettyjä riskitasoja:

Kaavakokoelma, testikaaviot ja jakaumataulukot liitteinä. Ei omia taulukoita! Laskin sallittu.

1. Nollahypoteesi on, että teksti on kirjoitettu lyhyemmällä murteella. Mahdollisiavaihtoehtojaonvainyksieliettäteksti

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

Harjoitus 7: NCSS - Tilastollinen analyysi

Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit

6.1.2 Yhdessä populaatiossa tietyn tyyppisten alkioiden prosentuaalista osuutta koskeva päättely

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

Sisällysluettelo ESIPUHE... 4 ALKUSANAT E-KIRJA VERSIOON... 5 SISÄLLYSLUETTELO JOHDANTO TILASTOLLISEEN PÄÄTTELYYN TODENNÄKÖISYYS...

Testit järjestysasteikollisille muuttujille

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Luentokalvoja tilastollisesta päättelystä. Kalvot laatinut Aki Taanila Päivitetty

Sovellettu todennäköisyyslaskenta B

Testit laatueroasteikollisille muuttujille

Jos nollahypoteesi pitää paikkansa on F-testisuuren jakautunut Fisherin F-jakauman mukaan

xi = yi = 586 Korrelaatiokerroin r: SS xy = x i y i ( x i ) ( y i )/n = SS xx = x 2 i ( x i ) 2 /n =

edellyttää valintaa takaisinpanolla Aritmeettinen keskiarvo Jos, ½ Ò muodostavat satunnaisotoksen :n jakaumasta niin Otosvarianssi Ë ¾

Mat Tilastollisen analyysin perusteet, kevät 2007

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin

Tilastotieteen jatkokurssi syksy 2003 Välikoe

2. TILASTOLLINEN TESTAAMINEN...

Tilastollisen analyysin perusteet Luento 4: Testi suhteelliselle osuudelle

Tavanomaisten otostunnuslukujen, odotusarvon luottamusvälin ja Box ja Whisker -kuvion määritelmät: ks. 1. harjoitukset.

Kyllä. Kyllä. Jäitkö vielä epävarmaksi: Selvitä antavatko testit samansuuntaisen tuloksen.

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Otoskoko 107 kpl. a) 27 b) 2654

c) A = pariton, B = ainakin 4. Nyt = silmäluku on5 Koska esim. P( P(A) P(B) =, eivät tapahtumat A ja B ole riippumattomia.

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 6. luento. Pertti Palo

pisteet Frekvenssi frekvenssi Yhteensä

Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Kynä-paperi -harjoitukset. Taina Lehtinen Taina I Lehtinen Helsingin yliopisto

MTTTP5, luento Otossuureita ja niiden jakaumia (jatkuu)

031021P Tilastomatematiikka (5 op) kertausta 2. vk:een

Tilastollisen analyysin perusteet Luento 11: Epäparametrinen vastine ANOVAlle

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi. Viikko 5

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2005) 1

Johdatus tilastotieteeseen Tilastolliset testit. TKK (c) Ilkka Mellin (2005) 1

54. Tehdään yhden selittäjän lineaarinen regressioanalyysi, kun selittäjänä on määrällinen muuttuja (ja selitettävä myös):

Sovellettu todennäköisyyslaskenta B

Mat Tilastollisen analyysin perusteet, kevät 2007

Aki Taanila TILASTOLLISEN PÄÄTTELYN ALKEET

5. Kahden tunnusluvun erotuksen merkitsevyys

Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1

/1. MTTTP5, luento Normaalijakauma (jatkuu) Binomijakaumaa voidaan approksimoida normaalijakaumalla

/1. MTTTP5, luento Kertausta. Olk. X 1, X 2,..., X n on satunnaisotos N(µ, ):sta, missä tunnettu. Jos H 0 on tosi, niin

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

Mat Tilastollisen analyysin perusteet, kevät 2007

dx=5&uilang=fi&lang=fi&lvv=2014

riippumattomia ja noudattavat samaa jakaumaa.

OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi. Luento 3

Aineistokoko ja voima-analyysi

MTTTP1, luento KERTAUSTA

Tilastollinen aineisto Luottamusväli

Sovellettu todennäköisyyslaskenta B

806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy (1 α) = 99 1 α = 0.

Lisätehtäviä ratkaisuineen luentomonisteen lukuihin 2-4 liittyen

Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus KE (2014) 1

voidaan hylätä, pienempi vai suurempi kuin 1 %?

Tilastollisen analyysin perusteet Luento 6: Korrelaatio ja riippuvuus tilastotieteessä

/1. MTTTP5, luento Normaalijakauma (jatkuu) Binomijakaumaa voidaan approksimoida normaalijakaumalla

Hypoteesin testaus Alkeet

Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1

Johdatus varianssianalyysiin. Vilkkumaa / Kuusinen 1

Aki Taanila VARIANSSIANALYYSI

Mitä tarvitsee tietää biostatistiikasta ja miksi? Matti Uhari Lastentautien klinikka Oulun yliopisto

Mat Tilastollisen analyysin perusteet, kevät 2007

Mittaustulosten tilastollinen käsittely

Testaa onko myrkkypitoisuus eri ryhmissä sama. RATK. Lasketaan kaikkien havaintoarvojen summa: k T i = = 486.

MTTTP5, luento Kahden jakauman sijainnin vertailu (jatkoa) Tutkimustilanteita y = neliöhinta x = sijainti (2 aluetta)

Aki Taanila TILASTOLLISEN PÄÄTTELYN ALKEET

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

11. laskuharjoituskierros, vko 15, ratkaisut

031021P Tilastomatematiikka (5 op) kertausta 2. vk:een

Transkriptio:

A. r = 0. n = Tilastollista testausta varten määritetään aluksi hypoteesit. H 0 : Korrelaatiokerroin on nolla. H : Korrelaatiokerroin on nollasta poikkeava. Tarkastetaan oletukset: - Kirjoittavat väittävät muuttujien olevan välimatka-asteikollisia. Oletetaan tämän pitävän paikkansa. - Normaalijakautuneisuudesta ei ole mainintaa. Oletetaan aineiston soveltuvan testaukseen ja suoritetaan lasku: 0. t 0. df = - = 9 0. 9 0.959.4.47 0.975 Tarkastetaan vertailuarvo t-jakauman taulukosta. Esim. kun vapausasteita on 0, riskitasolla 0.05 saadaan vertailuarvoksi.984 (df = 00) ja tasolla 0.0 saadaan.66 (df = 00). Tämän mukaan siis tulos on tilastollisesti melkein merkitsevä. Kirjoittaja on siis vähintäänkin tehnyt virheen ilmoittaessaan p-arvoa, jonka tulisi olla p < 0.05. B. Tehtävä kannattaa ratkaista riippuvien otosten t-testillä. Muodostetaan aluksi hypoteesit: H 0 : Mittauskertojen välillä ei ole eroa, ts. µ = µ. H : Mittauskertojen välillä on eroa, ts. µ µ. Oletukset: Satunnaisotanta perusjoukosta pitää tehtävänannon mukaan paikkansa. Lasketaan mittalukujen erotukset ja tarkastetaan, että erotusten jakauma on normaalisti jakautunut (KS-testin mukaan se pitää paikkansa, mutta sitä ei tarvitse tässä todistaa). Testisuuretta voidaan alkaa laskea taulukkomuodossa. Merkitään x:llä ensimmäistä mittauskertaa ja y:llä toista: Kh x y x-y (x-y) 6 5 5 9 0 9 8 3 6 4 4 4 9 4 5 5 5 8-3 9 6 3 8 5 5 7 8 0-4 9 0 8 4 0 3 9 4 6 6 4 4 - Summa 63 34 9 99 K.a. 3.58.7.4

Havaitaan, että ensimmäisen mittauskerran keskiarvo (3.58) on korkeampi kuin toisen (.7). Lasketaan erotuksien hajonta, testisuureen arvo ja vapausasteet. Sd (x i ( (x i yi )) yi ) n n (9) 99 99 70.083 8.97.7 3.43.4 t 3.43/.45 df = n - = Vertailuarvoksi saadaan t-jakauman taulukosta kaksisuuntaiselle testille riskitasolla 0.05 arvo.0 ja tasolla 0.0 arvo 3.06. Otoksesta saatu arvo sijaitsee näiden kahden arvon välillä, joten tulos on tilastollisesti melkein merkitsevä. Jos tarkastellaan tulosta tällä tasolla, niin silloin masentuneisuus on muuttunut. C. Tehtävässä tarkastellaan suhteellista osuutta ja tässä sopii käytettäväksi yhden otoksen suhteellisen osuuden testi. Tehtävänannosta saadaan laskussa tarvittavia lukuja: X = 8, n = 5 ja p 0 = 0.0. Tässä siis p = 8 / 5 = 0. H 0 : Huonoksi terveytensä tunteneiden osuus ei eroa kriteeriarvosta, ts. p = p 0. H : Huonoksi terveytensä tunteneiden osuus eroaa kriteeriarvosta, ts. p p 0. Voidaan suorittaa lasku sijoittamalla arvot kaavaan. z 8 5*0.0 5 *0.0 *( 0.0) 8 50.4 40.3.4 3.53 6.35 Tarkastellaan tuloksen itseisarvoa 3.53. Normaalijakauman kriittinen arvo riskitasolla 0.05 on.96, joten tämä arvo on selkeästi sen yläpuolella. Voidaan siis sanoa, että huonoksi terveytensä tunteneiden osuus eroaa aikaisemmasta (jopa riskitasolla 0.00). D. Edellistä tehtävää vastaava tehtävä, mutta nyt käytetään yhden otoksen keskiarvotestiä. Tehtävänannosta saadaan laskuun tarvittavia lukuja: x 8. 99, s = 57.38, n = 69, µ 0 =0. H 0 : Otoksen keskimääräinen puristusvoima ei eroa kriteeriarvosta, ts. µ = µ 0. H : Otoksen keskimääräinen puristusvoima eroaa kriteeriarvosta, ts. µ µ 0. Tarkastetaan oletukset: ) Kyseessä on satunnaisotos, joten riippumattomuus lienee kunnossa.

) Kädenpuristusvoima on suhdeasteikollinen muuttuja (voimalla on nollakohta), joten testin käyttö soveltuu sille. 3) Muuttujan normaalijakautuneisuus täytyy olettaa, koska siitä ei sanota tehtävänannossa tämän tarkemmin. Testin käyttö näyttäisi olevan pääosin perusteltua. Lasku voidaan suorittaa kun huomioidaan, että joudutaan käyttämään otoksen keskihajontaa kaavassa ja tällöin käytössä on t-testisuure: t 8.99 0 57.38/ 69 8.99 57.38/3 8.99 4.44.037 Vapausasteet ovat df = n - = 68. Riskitasolla 0.05 taulukosta saadaan vertailuarvoksi.984 (df = 00) ja tasolla 0.0 arvo on.60 (df = 00). Tulos on siis tilastollisesti melkein merkitsevä. Tulos eroaa siis vain melkein merkitsevästi aikaisempien tutkimusten määrittämästä perusjoukon keskiarvosta. E. Kolesteroli on jatkuva muuttuja, joten erojen selvittämiseksi voidaan käyttää sopivaa keskiarvotestiä. Koska kyseessä on kahden erillisen ryhmän vertailu, on sopiva testi riippumattomien otosten t-testi. Kerätään tarvittava tieto tehtävänannosta: Miehet: Naiset: x = 6.03 x = 6.89 s =.9 s =.37 n = 04 n = 89 Keskiarvojen välinen ero (alle yksi yksikköä) näyttää varsin pieneltä kun sen suhteuttaa ryhmien keskihajontaan (yli yksi yksikköä). Muodostetaan aluksi hypoteesit: H 0 : Miesten ja naisten keskimääräinen kolesteroli arvo on yhtä suuri, ts. µ = µ. H : Miesten ja naisten keskimääräinen kolesteroli arvo ei ole yhtä suuri, ts. µ µ. Tarkastetaan oletusten voimassaolo: ) Otokset ovat riippumattomia otoksia perusjoukoista, sillä ne on satunnaisesti valittu. Lisäksi otokset ovat myös riippumattomia toisistaan, sillä ei ole mitään syytä olettaa riippuvuutta miesten ja naisten välille. ) Muuttujan jakauma oletetaan tässä normaalisti jakautuneeksi kummankin otoksen edustamassa perusjoukossa. 3) Varianssit voidaan olettaa yhtä suuriksi tehtävänannon mukaan. Aineisto näyttäisi soveltuvan pääosin tälle testille. Lasketaan aluksi varianssiestimaatin arvo: S (04 ).9 (89 ).37 04 89 45.8583 35.857 9 498.755 9.738.309 Sitten testisuureen arvo:

t 6.03.309 04 6.89 89 0.86.309 * 0. 0.86 5.39 0.60 Tästä arvosta tarkastellaan tässä kaksisuuntaisen hypoteesin tilanteessa itseisarvoa 5.39. Vapausasteet saadaan kaavalla df = n + n - = 9. Riskitasolla 0.00 taulukosta saadaan vertailuarvoksi 3.339 (df = 00) ja 3.30 (df = 500), joten erotukselle laskettu testisuureen arvo näyttää, että eroa tilastollisesti erittäin merkittävästi. (HUOM! Keskiarvojen erotus voi käytännössä olla pienikin, vaikka tilastollinen testi näyttää, että se on merkitsevä.) F. HUOM! Jos tätä tehtävää kysyttäisi tentissä tulisi laskea vain ylä- tai alapaineen välinen ero. Tässä tilanteessa joudutaan jälleen suorittamaan kahden otoksen väliset t-testit riippumattomille otoksille. H 0 : Miesten ja naisten keskimääräinen veren ylä/alapaine on yhtä suuri, ts. µ = µ. H : Miesten ja naisten keskimääräinen veren ylä/alapaine ei ole yhtä suuri, ts. µ µ. Oletukset: Oletetaan, että seuraavat oletukset pitävät paikkaansa. ) Otokset ovat riippumattomia otoksia perusjoukoista, ts. ne on satunnaisesti valittu. Lisäksi otokset ovat myös riippumattomia toisistaan. ) Muuttujan jakauma oletetaan tässä normaalisti jakautuneeksi kummankin otoksen edustamassa perusjoukossa. 3) Varianssit oletetaan yhtä suuriksi. Tarkastellaan aluksi yläpainetta: Lasketaan varianssiestimaatti, testisuureen arvo ja vapausasteet. S (03 )8.34 (9).5 03 9 34308.7 87990.976 9 99.47 9 48.833 0.465 t 54.69 0.465 03 60.66 9 5.97 0.465* 0. 5.97.50.39 Tarkastellaan tässä saadun luvun itseisarvoa (.39), koska testi on kaksisuuntainen. Vapausasteet ovat df = 03 + 9 - = 9. Riskitasolla 0.05 taulukosta saadaan vertailuarvoksi.97 (df = 500) tai.965 (df = 00). Otoksesta laskettu tulos on suurempi kuin vertailuarvo, joten nollahypoteesi hylätään. Yläpaineen kohdalla voidaan siis ajatella, että miehet ja naiset edustavat eri perusjoukkoja ja siten verenpainemittauksia ei voida käyttää yhtenä aineistona, vaan miesten ja naisten erilaiset verenpainearvot tulisi ottaa huomioon analyyseissä. Tarkastellaan sitten alapainetta:

S (03 )9.3 (9 )9.8 03 9 8840.96 83.56 9 763.8 9 93.04 9.645 t 85.74 9.645 03 85.9 9 0.55 9.645* 0. 0.55 0.47.79 Vapausasteilla df = 9 tarkastellaan jälleen testisuureen itseisarvoa 0.47. Riskitasolla 0.05 saadaan taulukosta samat vertailuarvot kuin edellä. Otoksen luku jää selkeästi näiden alapuolelle, joten nollahypoteesi jää voimaan. Alapaineen osalta ei havaittu tilastollisesti merkitsevää eroa. Tutkija voisi siis yhdistää miesten ja naisten aineiston sukupuolten osalta ja tarkastella sitä kokonaisuutena veren alapaineen suhteen.