Harjoitus 7: NCSS - Tilastollinen analyysi

Samankaltaiset tiedostot
ABHELSINKI UNIVERSITY OF TECHNOLOGY

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

Väliestimointi (jatkoa) Heliövaara 1

Sovellettu todennäköisyyslaskenta B

Mat Tilastollisen analyysin perusteet, kevät 2007

Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi. Viikko 5

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Tilastolliset testit. Tilastolliset testit. Tilastolliset testit: Mitä opimme? 2/5. Tilastolliset testit: Mitä opimme? 1/5

Johdatus tilastotieteeseen Tilastolliset testit. TKK (c) Ilkka Mellin (2005) 1

Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus KE (2014) 1

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2005) 1

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin

Johdatus varianssianalyysiin. Vilkkumaa / Kuusinen 1

Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1

Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1

Odotusarvoparien vertailu. Vilkkumaa / Kuusinen 1

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1

Sovellettu todennäköisyyslaskenta B

Testejä suhdeasteikollisille muuttujille

Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Testit laatueroasteikollisille muuttujille

Sovellettu todennäköisyyslaskenta B

Kaksisuuntainen varianssianalyysi. Vilkkumaa / Kuusinen 1

Mat Sovellettu todennäköisyyslasku A

Kaksisuuntainen varianssianalyysi. Heliövaara 1

Sovellettu todennäköisyyslaskenta B

Testit järjestysasteikollisille muuttujille

031021P Tilastomatematiikka (5 op) viikko 5

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

10. laskuharjoituskierros, vko 14, ratkaisut

Valitaan testisuure, jonka jakauma tunnetaan H 0 :n ollessa tosi.

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Sovellettu todennäköisyyslaskenta B

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

Tilastollisen analyysin perusteet Luento 11: Epäparametrinen vastine ANOVAlle

2. TILASTOLLINEN TESTAAMINEN...

Tutkimusongelmia ja tilastollisia hypoteeseja: Perunalastupussien keskimääräinen paino? Nollahypoteesi Vaihtoehtoinen hypoteesi (yksisuuntainen)

¼ ¼ joten tulokset ovat muuttuneet ja nimenomaan huontontuneet eivätkä tulleet paremmiksi.

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu

Todennäköisyyden ominaisuuksia

Mat Tilastollisen analyysin perusteet, kevät 2007

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170

Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit

Tilastollisen analyysin perusteet Luento 4: Testi suhteelliselle osuudelle

Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen., jos otoskeskiarvo on suurempi kuin 13,96. Mikä on testissä käytetty α:n arvo?

Jos nollahypoteesi pitää paikkansa on F-testisuuren jakautunut Fisherin F-jakauman mukaan

Tilastollinen testaaminen tai Tilastollinen päättely. Geneettinen analyysi

Mat Tilastollisen analyysin perusteet, kevät 2007

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Jos nyt on saatu havaintoarvot Ü ½ Ü Ò niin suurimman uskottavuuden

Tilastollisia peruskäsitteitä ja Monte Carlo

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Johdatus tilastotieteeseen Yhteensopivuuden, homogeenisuuden ja riippumattomuuden testaaminen. TKK (c) Ilkka Mellin (2004) 1

Sovellettu todennäköisyyslaskenta B

Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt: Mitä opimme? Latinalaiset neliöt

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

POPULAATIO. Oikeastaan arvot, joista ollaan kiinnostuneita (mitatut numeeriset suureet, luokittelut).

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

Tilastollisen analyysin perusteet Luento 6: Korrelaatio ja riippuvuus tilastotieteessä

edellyttää valintaa takaisinpanolla Aritmeettinen keskiarvo Jos, ½ Ò muodostavat satunnaisotoksen :n jakaumasta niin Otosvarianssi Ë ¾

χ = Mat Sovellettu todennäköisyyslasku 11. harjoitukset/ratkaisut

Luentokalvoja tilastollisesta päättelystä. Kalvot laatinut Aki Taanila Päivitetty

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Estimointi. Vilkkumaa / Kuusinen 1

Yhteensopivuuden, homogeenisuuden ja riippumattomuuden testaaminen

Tilastollisen analyysin perusteet Luento 5: Jakaumaoletuksien. testaaminen

Tilastollinen aineisto Luottamusväli

Estimointi. Otantajakauma

Lohkoasetelmat. Kuusinen/Heliövaara 1

Tilastotieteen kertaus. Kuusinen/Heliövaara 1

tilastotieteen kertaus

Tavanomaisten otostunnuslukujen, odotusarvon luottamusvälin ja Box ja Whisker -kuvion määritelmät: ks. 1. harjoitukset.

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 6. luento. Pertti Palo

Johdatus tilastotieteeseen Testit järjestysasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Osa 2: Otokset, otosjakaumat ja estimointi

Lohkoasetelmat. Vilkkumaa / Kuusinen 1

Lohkoasetelmat. Heliövaara 1

5.7 Uskottavuusfunktioon perustuvia testejä II

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

11. laskuharjoituskierros, vko 15, ratkaisut

Gripenberg. MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Tentti ja välikoeuusinta

Harjoitus 2: Matlab - Statistical Toolbox

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?

r = n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit.

Kertausluento. Vilkkumaa / Kuusinen 1

Mat Tilastollisen analyysin perusteet, kevät 2007

Sovellettu todennäköisyyslaskenta B

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

Teema 9: Tilastollinen merkitsevyystestaus

Testaa onko myrkkypitoisuus eri ryhmissä sama. RATK. Lasketaan kaikkien havaintoarvojen summa: k T i = = 486.

Useampisuuntainen varianssianalyysi. Useampisuuntainen varianssianalyysi. Useampisuuntainen varianssianalyysi

Estimointi. Luottamusvälin laskeminen keskiarvolle α/2 α/2 0.1

Sisällysluettelo ESIPUHE... 4 ALKUSANAT E-KIRJA VERSIOON... 5 SISÄLLYSLUETTELO JOHDANTO TILASTOLLISEEN PÄÄTTELYYN TODENNÄKÖISYYS...

1. Tilastollinen malli??

dx=5&uilang=fi&lang=fi&lvv=2014

Transkriptio:

Harjoitus 7: NCSS - Tilastollinen analyysi Mat-2.2107 Sovelletun matematiikan tietokonetyöt Syksy 2006 Mat-2.2107 Sovelletun matematiikan tietokonetyöt 1

Harjoituksen aiheita Tilastollinen testaus Testaukseen liittyvät hypoteesit P-arvot ja merkitsevyystasot Testit odotusarvolle Varianssianalyysi Mat-2.2107 Sovelletun matematiikan tietokonetyöt 2

Tilastollinen testaus Tilastollisessa testauksessa tutkitaan tutkimuskohteita koskevien oletusten tai väitteiden paikkansapitävyyttä havaintojen avulla. Testattavat oletukset tai väitteet tulee pukea tutkimuskohteiden tutkittavaa ominaisuutta kuvaavaa jakaumaa tai sen parametreja koskeviksi hypoteeseiksi. Mat-2.2107 Sovelletun matematiikan tietokonetyöt 3

Testausasetelman hypoteesit Testausasetelma kiinnitetään tekemällä seuraavat kolme oletusta: (i) Testausasetelmaa koskevia yleisiä oletuksia kutsutaan testin yleiseksi hypoteesiksi. (ii) Testattavaa väitettä tai oletusta kutsutaan testin nollahypoteesiksi. (iii) Jos nollahypoteesi hylätään testissä, astuu voimaan vaihtoehtoinen hypoteesi. Mat-2.2107 Sovelletun matematiikan tietokonetyöt 4

Yleinen hypoteesi Yleinen hypoteesi H sisältää oletukset - perusjoukosta - käytetystä otantamenetelmästä - perusjoukon jakaumasta Yleisen hypoteesin oletuksista pidetään kiinni koko testauksen ajan. Yleisen hypoteesin sisältämiä jakaumaoletuksia voidaan ja on yleensä syytä testata erikseen. Mat-2.2107 Sovelletun matematiikan tietokonetyöt 5

Nollahypoteesi Sitä perusjoukon jakauman parametreja koskevaa väitettä tai oletusta, jota halutaan testata kutsutaan nollahypoteesiksi, ja merkitään H 0. Nollahypoteesista H 0 pidetään kiinni, elleivät havaintojen sisältämät todisteet nollahypoteesia vastaan ole kyllin voimakkaita. Yksinkertaisissa testausasetelmissa nollahypoteesi on muotoa H 0 : θ = θ 0 Mat-2.2107 Sovelletun matematiikan tietokonetyöt 6

Vaihtoehtoinen hypoteesi Vaihtoehtoinen hypoteesi H 1 on oletus, joka astuu voimaan, jos nollahypoteesi H 0 hylätään. Jos vaihtoehtoinen hypoteesi on muotoa H 1 : θ > θ 0 tai muotoa H 1 : θ < θ 0 vaihtoehtoista hypoteesia kutsutaan yksisuuntaiseksi. Jos vaihtoehtoinen hypoteesi on muotoa H 1 : θ θ 0 vaihtoehtoista hypoteesia kutsutaan kaksisuuntaiseksi. Mat-2.2107 Sovelletun matematiikan tietokonetyöt 7

Testisuure Tilastollinen testi perustuu testisuureeseen, joka mittaa havaintojen ja nollahypoteesin H 0 yhteensopivuutta. Testisuure on satunnaismuuttuja, jonka arvo riippuu havainnoista ja nollahypoteesista H 0. Havaintojen ja nollahypoteesin H 0 yhteensopivuuden mittaaminen tarkoittaa sitä, että tutkitaan kuinka todennäköistä on saada sellaisia testisuureen arvoja kuin on saatu, ehdolla että H 0 pätee. Yhteensopivuuden mittaaminen vaatii siis testisuureen jakauman tuntemista. Mat-2.2107 Sovelletun matematiikan tietokonetyöt 8

Testisuureen normaaliarvo Testisuureen odotusarvoa nollahypoteesin H 0 pätiessä kutsutaan testisuureen normaaliarvoksi. Jos testisuureen havaittu arvo on lähellä normaaliarvoa, havainnot ovat sopusoinnussa nollahypoteesin H 0 kanssa. Jos testisuureen havaittu arvo poikkeaa merkitsevästi normaaliarvosta, havainnot sisältävät todisteita nollahypoteesia H 0 vastaan. Mat-2.2107 Sovelletun matematiikan tietokonetyöt 9

Virheet testauksessa Jos nollahypoteesi H 0 hylätään silloin kun se on tosi, tehdään hylkäysvirhe. Hylkäysvirheen todennäköisyys α on muotoa Pr(H 0 hylätään H 0 on tosi) = α Jos nollahypoteesi H 0 jätetään voimaan silloin kun se ei ole tosi, tehdään hyväksymisvirhe. Hyväksymisvirheen todennäköisyys β on muotoa Pr(H 0 jätetään voimaan H 0 ei ole tosi) = β Hylkäysvirheen todennäköisyyttä α kutsutaan testin merkitsevyystasoksi. Mat-2.2107 Sovelletun matematiikan tietokonetyöt 10

Hylkäys- ja hyväksymisalueet Tilastollisessa testauksessa testisuureen mahdollisten arvojen joukko jaetaan kahteen osaan (i) Jos testisuureen Z havainnoista laskettu arvo joutuu hylkäysalueelle, nollahypoteesi H 0 hylätään. (ii) Jos testisuureen Z havainnoista laskettu arvo joutuu hyväksymisalueelle, nollahypoteesi H 0 jätetään voimaan. f(z H 0 pätee) 1 α α Hyväksymisalue Hylkäysalue Mat-2.2107 Sovelletun matematiikan tietokonetyöt 11

P-arvo ja merkitsevyystasot Testin p-arvo kertoo todennäköisyyden, että testisuureen poikkeama sen normaaliarvosta johtuu sattumasta. - H 0 voidaan hylätä, jos testin p-arvo on pienempi kuin testin merkitsevyystaso. Tilastolliset ohjelmistot tulostavat nykyään lähes aina testien p-arvot. - P-arvojen käyttö on lähes kokonaan syrjäyttänyt etukäteen valittujen kiinteiden merkitsevyystasojen käytön. f(z H 0 pätee) Testisuureen Z normaaliarvo Testisuureen Z arvo p arvo Mat-2.2107 Sovelletun matematiikan tietokonetyöt 12

Tilastollisen testin suorittamisen vaiheet Tilastollisen testin suorittaminen sisältää seuraavat vaiheet: (1) Asetetaan testin hypoteesit. (2) Valitaan testisuure. (3) Valitaan merkitsevyystaso α ja muodostetaan sitä vastaava hylkäysalue. (4) Poimitaan otos niin, että yleisen hypoteesin oletukset pitävät. (5) Lasketaan testisuureen arvo havainnoista. (6) Tehdään päätös nollahypoteesin hylkäämisestä. Mat-2.2107 Sovelletun matematiikan tietokonetyöt 13

Testi perusjoukon odotusarvolle, kun otos on normaalijakaumasta Yleinen hypoteesi H : (1) X i N(µ, σ 2 ), i = 1,...,n (2) Satunnaismuuttujat X 1,...,X n ovat riippumattomia Nollahypoteesi H 0 : µ = µ 0 Vaihtoehtoiset hypoteesit H 1 : µ > µ 0, H 1 : µ < µ 0, H 1 : µ µ 0 Testisuure T = X µ 0 s/ n Testisuureen jakauma Jos nollahypoteesi pätee, T t(n 1). Mat-2.2107 Sovelletun matematiikan tietokonetyöt 14

Testejä suhdeasteikollisille muuttujille 1/2 Yhden otoksen t-testi - odotusarvon vertaaminen tunnettuun vakioon Kahden otoksen t-testi A - Kahden riippumattoman otoksen odotusarvojen vertaaminen, erisuuret varianssit Kahden otoksen t-testi B - Kahden riippumattoman otoksen odotusarvojen vertaaminen, yhtäsuuret varianssit t-testi parivertailuille - Kahden toisistaan riippuvan otoksen odotusarvojen erotuksen vertaaminen Mat-2.2107 Sovelletun matematiikan tietokonetyöt 15

Testejä suhdeasteikollisille muuttujille 2/2 Testi varianssille - Varianssin vertaaminen tunnettuun vakioon Varianssien vertailutesti - Kahden riippumattoman otoksen varianssien vertaaminen Mat-2.2107 Sovelletun matematiikan tietokonetyöt 16

Varianssianalyysi Varianssianalyysi voidaan ymmärtää kahden riippumattoman otoksen t-testin yleistykseksi tilanteisiin, jossa perusjoukko koostuu useammasta kuin kahdesta ryhmästä: (i) Perusjoukko koostuu kahdesta tai useammasta ryhmästä. (ii) Havainnot noudattavat jokaisessa ryhmässä normaalijakaumaa. (iii) Jokaisesta ryhmästä poimitaan toisistaan riippumattomat yksinkertaiset satunnaisotokset. (iv) Tehtävänä on testata ryhmäkohtaisten odotusarvojen yhtäsuuruutta. Nollahypoteesi: Ryhmien odotusarvoissa ei ole eroja. H 0 : µ 1 = µ 2 =... = µ i = µ Mat-2.2107 Sovelletun matematiikan tietokonetyöt 17

Yksi- ja useampisuuntainen varianssianalyysi Perusjoukon jako ryhmiin voidaan tehdä yhden tai useamman tekijän perusteella. Jos perusjoukon jako ryhmiin perustuu yhteen tekijään, puhutaan yksisuuntaisesta varianssianalyysista. Jos perusjoukon jako ryhmiin perustuu m tekijään, puhutaan m-suuntaisesta varianssianalyysista. Varianssianalyysin nimi johtuu siitä, että ryhmäkohtaisten odotusarvojen yhtäsuuruuden testaaminen perustuu kahden eri varianssiestimaattorin yhtäsuuruuden testaamiseen F-testeillä. Mat-2.2107 Sovelletun matematiikan tietokonetyöt 18

Milloin varianssianalyysiä voidaan käyttää Varianssianalyysin hyöty: Usean ryhmän odotusarvoja voidaan vertailla yhdellä kokeella. - T-testillä olisi pitänyt suorittaa parivertailu jokaiselle parille erikseen Työlästä Kuten t-testiä käytettäessä, myös varianssianalyysiä käytettäessä havaintojen tulee olla peräisin normaalijakaumasta. Mat-2.2107 Sovelletun matematiikan tietokonetyöt 19

NCSS NCSS (Number Cruncher Statistical System) on nopea ja monipuolinen havaintoaineiston tilastolliseen käsittelyyn soveltuva ohjelmisto. Ohjelmiston avulla voidaan suorittaa useimmat tilastolliset analyysit sekä tulostaa tulokset numeerisessa ja graafisessa muodossa. Mat-2.2107 Sovelletun matematiikan tietokonetyöt 20

NCSS-ohjelmiston osat NCSS Datassa suoritetaan tiedonhallinta. Analysoitava aineisto voidaan syöttää näppäimistöltä tai lukea erillisestä tiedostosta. Ohjelma osaa lukea useita eri tiedostoformaatteja. Käyttöliittymä on kuten taulukkolaskennassa. NCSS Templatessa määritetään kulloinkin tehtävän analyysin yksityiskohdat. Joissain tapauksissa määritettäviä kohteita on todella paljon. NCSS Outputiin tulostuvat analyysin tulokset halutussa muodossa. Tulostusta tulee perusasetuksilla runsaasti. Vaikeinta onkin löytää se oleellinen. Lisäksi loki-ikkunaan voidaan siirtää tallennettavaksi haluttavia tulosteita. Mat-2.2107 Sovelletun matematiikan tietokonetyöt 21

Kysymyksiä 1. Mitä tarkoitetaan termeillä yleinen hypoteesi, nollahypoteesi ja vaihtoehtoinen hypoteesi? 2. Mitkä p-arvot aiheuttavat H 0 :n hylkäämisen, kun merkitsevyystaso α = 0.05? 3. Millä tilastollisella testillä voidaan tutkia, poikkeaako otoksen keskiarvo oletetusta, kun havaintoaineisto oletetaan normaalijakautuneeksi? 4. Millä tilastollisella testillä voidan tutkia, poikkeaako otoksen mediaani oletetusta? Perustuuko testi oletukseen, että havaintoaineisto on normaalijakautunut? 5. Mitä varianssianalyysillä voidaan tutkia? 6. Mitä eroa on yksi- ja kaksisuuntaisessa varianssianalyysissa? Mat-2.2107 Sovelletun matematiikan tietokonetyöt 22