Sisällysluettelo ESIPUHE... 4 ALKUSANAT E-KIRJA VERSIOON... 5 SISÄLLYSLUETTELO... 6 1. JOHDANTO TILASTOLLISEEN PÄÄTTELYYN... 8 2. TODENNÄKÖISYYS...



Samankaltaiset tiedostot
Sisällysluettelo ESIPUHE KIRJAN 1. PAINOKSEEN...3 ESIPUHE KIRJAN 2. PAINOKSEEN...3 SISÄLLYSLUETTELO...4

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

Väliestimointi (jatkoa) Heliövaara 1

ABHELSINKI UNIVERSITY OF TECHNOLOGY

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170

r = n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit.

Sisällysluettelo LUKU I METODOLOGIAN PERUSTEET IHMISTIETEISSÄ ESIPUHE...III ESIPUHE KIRJAN TOISEEN PAINOKSEEN... VIII SISÄLLYSLUETTELO...

Mat Tilastollisen analyysin perusteet, kevät 2007

Harjoitus 7: NCSS - Tilastollinen analyysi

Jos nollahypoteesi pitää paikkansa on F-testisuuren jakautunut Fisherin F-jakauman mukaan

11. laskuharjoituskierros, vko 15, ratkaisut

Sovellettu todennäköisyyslaskenta B

HAVAITUT JA ODOTETUT FREKVENSSIT

Testejä suhdeasteikollisille muuttujille

Sovellettu todennäköisyyslaskenta B

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu

ALKUSANAT... 4 ALKUSANAT E-KIRJA VERSIOON... 5 SISÄLLYSLUETTELO... 6

Mat Sovellettu todennäköisyyslasku A

Johdatus tilastotieteeseen Tilastolliset testit. TKK (c) Ilkka Mellin (2005) 1

χ = Mat Sovellettu todennäköisyyslasku 11. harjoitukset/ratkaisut

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu

Tutkimusongelmia ja tilastollisia hypoteeseja: Perunalastupussien keskimääräinen paino? Nollahypoteesi Vaihtoehtoinen hypoteesi (yksisuuntainen)

Jos nyt on saatu havaintoarvot Ü ½ Ü Ò niin suurimman uskottavuuden

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Valitaan testisuure, jonka jakauma tunnetaan H 0 :n ollessa tosi.

Luentokalvoja tilastollisesta päättelystä. Kalvot laatinut Aki Taanila Päivitetty

χ 2 -yhteensopivuustestissä käytetään χ 2 -testisuuretta χ = Mat Sovellettu todennäköisyyslasku A

Sovellettu todennäköisyyslaskenta B

Estimointi. Otantajakauma

Aki Taanila TILASTOLLISEN PÄÄTTELYN ALKEET

Kynä-paperi -harjoitukset. Taina Lehtinen Taina I Lehtinen Helsingin yliopisto

Odotusarvoparien vertailu. Vilkkumaa / Kuusinen 1

Tilastotieteen jatkokurssi syksy 2003 Välikoe

Tilastollinen testaaminen tai Tilastollinen päättely. Geneettinen analyysi

Estimointi. Luottamusvälin laskeminen keskiarvolle α/2 α/2 0.1

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Sovellettu todennäköisyyslaskenta B

Tilastolliset testit. Tilastolliset testit. Tilastolliset testit: Mitä opimme? 2/5. Tilastolliset testit: Mitä opimme? 1/5

10. laskuharjoituskierros, vko 14, ratkaisut

Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1

Johdatus varianssianalyysiin. Vilkkumaa / Kuusinen 1

1. Tilastollinen malli??

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

Tilastollisen analyysin perusteet Luento 4: Testi suhteelliselle osuudelle

Ongelma: Poikkeaako perusjoukon suhteellinen osuus vertailuarvosta?

Testit järjestysasteikollisille muuttujille

Matemaatikot ja tilastotieteilijät

Mat Tilastollisen analyysin perusteet, kevät 2007

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi. Viikko 5

5. Kahden tunnusluvun erotuksen merkitsevyys

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 6. luento. Pertti Palo

Mat Tilastollisen analyysin perusteet, kevät 2007

¼ ¼ joten tulokset ovat muuttuneet ja nimenomaan huontontuneet eivätkä tulleet paremmiksi.

1. Normaalisuuden tutkiminen, Bowmanin ja Shentonin testi, Rankit Plot, Wilkin ja Shapiron testi

1. Nollahypoteesi on, että teksti on kirjoitettu lyhyemmällä murteella. Mahdollisiavaihtoehtojaonvainyksieliettäteksti

Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1

Tilastollisia peruskäsitteitä ja Monte Carlo

Sovellettu todennäköisyyslaskenta B

Hypoteesin testaus Alkeet

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Tilastollisen analyysin perusteet Luento 6: Korrelaatio ja riippuvuus tilastotieteessä

Tavanomaisten otostunnuslukujen, odotusarvon luottamusvälin ja Box ja Whisker -kuvion määritelmät: ks. 1. harjoitukset.

SEM1, työpaja 2 ( )

Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Mitä tarvitsee tietää biostatistiikasta ja miksi? Matti Uhari Lastentautien klinikka Oulun yliopisto

voidaan hylätä, pienempi vai suurempi kuin 1 %?

Kaavakokoelma, testikaaviot ja jakaumataulukot liitteinä. Ei omia taulukoita! Laskin sallittu.

Yhteensopivuuden, homogeenisuuden ja riippumattomuuden testaaminen

031021P Tilastomatematiikka (5 op) viikko 5

2. TILASTOLLINEN TESTAAMINEN...

Tilastollisen analyysin perusteet Luento 11: Epäparametrinen vastine ANOVAlle

Normaalijakaumasta johdettuja jakaumia

Kertausluento. Tilastollinen päättely II - 2. kurssikoe

Matemaattinen tilastotiede. Erkki Liski Matematiikan, Tilastotieteen ja Filosofian Laitos Tampereen Yliopisto

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

edellyttää valintaa takaisinpanolla Aritmeettinen keskiarvo Jos, ½ Ò muodostavat satunnaisotoksen :n jakaumasta niin Otosvarianssi Ë ¾

Aineistokoko ja voima-analyysi

Gripenberg. MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Tentti ja välikoeuusinta

Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit

Pienet ännät tutkimuksessa Tilastollisen analyysin työpaja. Jari Westerholm Niilo Mäki instituutti Jyväskylän yliopisto

Aki Taanila TILASTOLLISEN PÄÄTTELYN ALKEET

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

voidaan hylätä, pienempi vai suurempi kuin 1 %?

Teema 9: Tilastollinen merkitsevyystestaus

Mat Tilastollisen analyysin perusteet, kevät 2007

Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus KE (2014) 1

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2005) 1

Aki Taanila TILASTOLLISEN PÄÄTTELYN ALKEET

3. a) Mitkä ovat tilastolliset mitta-asteikot? b) Millä tavalla nominaaliasteikollisen muuttujan jakauman voi esittää?

Metsämuuronen: Tilastollisen kuvauksen perusteet ESIPUHE... 4 SISÄLLYSLUETTELO METODOLOGIAN PERUSTEIDEN KERTAUSTA AINEISTO...

Kvantitatiiviset tutkimusmenetelmät maantieteessä

Johdatus tilastotieteeseen Yhteensopivuuden, homogeenisuuden ja riippumattomuuden testaaminen. TKK (c) Ilkka Mellin (2004) 1

Jahtipaikat.fi Käyttöohje

Aki Taanila TILASTOLLINEN PÄÄTTELY

Aineistoista. Laadulliset menetelmät: miksi tarpeen? Haastattelut, fokusryhmät, havainnointi, historiantutkimus, miksei videointikin

Transkriptio:

Sisällysluettelo ESIPUHE... 4 ALKUSANAT E-KIRJA VERSIOON... 5 SISÄLLYSLUETTELO... 6 1. JOHDANTO TILASTOLLISEEN PÄÄTTELYYN... 8 1.1 INDUKTIO JA DEDUKTIO... 9 1.2 SYYT JA VAIKUTUKSET... 11 TEHTÄVIÄ... 13 2. TODENNÄKÖISYYS... 14 2.1 MERKINTÖJÄ... 15 2.2 KLASSINEN TODENNÄKÖISYYS... 16 2.3 TODENNÄKÖISYYDEN FREKVENSSITULKINTA... 17 2.4 TODENNÄKÖISYYDEN OMINAISUUKSIA... 17 2.5 TODENNÄKÖISYYS JA P-ARVO... 20 2.6 TODENNÄKÖISYYS JA PINTA-ALATULKINTA... 21 TEHTÄVIÄ... 22 3. OTANTAJAKAUMAT JA NIIDEN KÄYTTÖ... 23 3.1 EPÄJATKUVIA JAKAUMIA... 24 3.2 NORMAALIJAKAUMA... 25 3.3 T-JAKAUMA JA χ 2 -JAKAUMA... 28 4. HYPOTEESIEN TESTAAMINEN... 30 4.1 TESTATTAVA HYPOTEESI... 30 4.2 HYPOTEESI MATEMAATTISESSA MUODOSSA... 31 4.3 PÄÄTÖSTEORIA JA TESTISUURE... 33 4.4 KIINTEÄN P-ARVON KÄYTTÖ... 36 4.5 P-ARVON ETSIMINEN TAULUKOSTA JA TIETOKONEELLA... 38 Kiinteä p-arvo taulukossa... 38 Havaittu p-arvo laskentataulukko-ohjelmassa... 39 4.6 MERKITTÄVYYS JA MERKITSEVYYS... 41 TEHTÄVIÄ... 42 5. JAKAUMIA HYÖDYNTÄVIÄ TESTEJÄ... 43 5.1 χ 2 RIIPPUMATTOMUUSTESTIN TULKINTA... 43 5.2 KORRELAATION MERKITSEVYYS... 45 5.3 KAHDEN KORRELAATION ERON MERKITSEVYYS... 46 5.4 T-TESTIN TULKINTA... 48 5.4 PIENI OTOSKOKO JA JAKAUMAOLETUS... 50 TEHTÄVIÄ... 51 6. LUOTTAMUSVÄLI JA SEN LASKEMINEN... 52 6

6.1 LUOTTAMUSVÄLIN LASKEMINEN... 52 6.2 ESIMERKKI LUOTTAMUSVÄLIN LASKEMISESTA... 54 6.3 CRONBACHIN ALFA JA SEN LUOTTAMUSVÄLIN LASKEMINEN... 54 Alfan luottamusvälin laskemisen tekniikka... 56 Kriittiset pisteet ja luottamusväli SPSS -ohjelmistolla... 57 Kriittiset pisteet ja luottamusväli Excel-laskentataulukolla... 60 Kriittiset pisteet ja luottamusväli SURVO 98C ohjelmistolla... 62 Alfan luottamusväli ja erilaiset otoskoot... 64 Johtopäätöksiä alfan luottamusvälistä... 64 TEHTÄVIÄ... 65 7. TULOSTEN TARKASTELU JA POHDINTA... 66 7.1 MATEMATIIKKA JA TULKINNAT... 66 7.2 TULOKSET JA TULKINNAT... 67 7.3 SUOSITUKSET JA TULKINNAT... 67 8. LOPUKSI... 69 LÄHTEET... 70 ASIA- JA HENKILÖHAKEMISTO... 71 TAULUKOT... 73 7

4.5 p-arvon etsiminen taulukosta ja tietokoneella Tilastotiedon parhaissa menetelmäkirjoissa on taulukoitu edellä mainittujen kolmen merkitsevyystason mukaisia kriittisiä arvoja. Esimerkiksi Ranta-Rita-Koukissa (1986) on huomattava määrä erilaisia tilastollisia taulukoita. Toisaalta nykyisillä taulukkolaskentaohjelmilla kuten esimerkiksi Excelillä on mahdollista laskea hyvin yksinkertaisesti samat kriittiset arvot, mutta myös havaittuja p-arvoja. Tässä luvussa käydään nopeasti läpi molemmat mahdollisuudet löytää oman tutkimuksen kannalta oleelliset vertailuarvot nollahypoteesin hylkäämisen tai hyväksymisen ratkaisemiseksi. Kiinteä p-arvo taulukossa Jos tiedämme testisuureen arvon sanokaamme vaikka χ 2 -testiarvon voimme valmiiksi taulukoitujen arvojen perusteella päätellä, pitäisikö nollahypoteesi hylätä vai saako nollahypoteesi tukea. Kiinteää p-arvoa etsittäessä taulukosta tarvitaan kaksi tietoa: 1. millä riskitasolla päätelmä tehdään, eli mikä on valittu p-arvo 2. mikä on vapausaste eli degrees of freedom, lyhyemmin df Jos otamme esimerkiksi Tilastollisen kuvauksen perusteet kirjassa esitetyn ristiintaulukon analyysin yhteydessä saadun χ 2 testiarvon 2.727, tiedämme samalla myös vapausasteet. Ristiintaulukkomme oli 2x2 taulukko, joten tarvitsemamme vapausaste on 1, joka merkitään df=1. Tämä yleensä ilmaistaan myös itse χ 2 testiarvon merkinnässä, joka tarkalleen ottaen pitäisi merkitä χ 2 (1), jossa suluissa oleva 1 viittaa vapausasteisiin. Valitsemme kaksisuuntaiseksi riskitasoksi 5 % eli 0.05. Näin ollen χ 2 taulukon avulla voimme päätellä edustaako saamamme testisuureen arvo 2.727 niin harvinaista tapausta jakaumassa, että H o joudutaan hylkäämään. Kriittinen piste luetaan taulukosta siitä risteyspisteestä, jossa kohtaavat yhden vapausasteen rivi ja 0.05 arvon sarake. 38

p-arvo = 0.05 Vapausaste=1 df 0.1 0.05 0.01 0.001 1 2.706 3.841 6.635 10.828 2 4.605 5.991 9.210 13.816 3 6.251 7.815 11.345 16.266 4 7.779 9.488 13.277 18.467 5 9.236 11.070 15.086 20.515 6 10.645 12.592 16.812 22.458 7 12 017 14 067 18 475 24 322 Kriittinen piste on 3.841. Tätä arvoa suurempia arvoja (mukaan lukien itse arvo) on siis tuon muotoisessa χ 2 jakaumassa 5 %. Nyt saamamme χ 2 arvo 2.727 on pienempi kuin ko. kriittinen piste, joten emme voi hylätä nollahypoteesia. Havaittu p-arvo laskentataulukko-ohjelmassa Nykyisin lienee helpompi etsiä havaittuja p-arvoja tietokoneella kuin taulukkokirjoista selaillen. Havaittu p-arvo on tarkempi mitta kuin kiinteä p-arvo. Jo aiemmin olemme todenneet, ettei mikään järkeilyperuste puolla kiinteän p-arvon käyttöä kuin erikoistilanteissa. Excel-taulukkolaskentaohjelmassa havaittu p-arvo haetaan seuraavasti. Missä hyvänsä taulukon ruudussa kaksoisklikataan ruutua ja kirjoitetaan = -merkki ja etsitään funktionäppäin painike tai Lisää Funktio komento. Funktionäppäin 39

Funktionäppäimen painamisen jälkeen avautuu ikkuna, josta valitaan sopiva jakauma: χ 2 jakauma löytyy nimellä CHIJA- KAUMA, t-jakauma löytyy nimellä TJAKAUMA ja f- jakauma nimellä FJAKAUMA. Ikkunan alareunassa kerrotaan että tarvitaan kaksi arvoa: x ja vapausasteet. Luvuista x viittaa testisuureen arvoon (2.727) ja toinen nimensä mukaiseen vapausasteeseen (1). OK-näppäintä painamalla pääsemme antamaan kyseiset arvot ja saamme khiin neliö -jakauman todennäköisyyden. Taulukko kertookin meille jo tässä vaiheessa, että ko. pisteen ja sitä suurempien arvojen todennäköisyys on 0.0987. Huomattakoon, että luvussa 2.727 on käytettävä pilkkua, jotta Excel ymmärtäisi sen numeroksi. OK-näppäintä painamalla saamme havaitun p-arvon Excel taulukkoon: 40