Sisällysluettelo ESIPUHE KIRJAN 1. PAINOKSEEN...3 ESIPUHE KIRJAN 2. PAINOKSEEN...3 SISÄLLYSLUETTELO...4



Samankaltaiset tiedostot
Sisällysluettelo ESIPUHE... 4 ALKUSANAT E-KIRJA VERSIOON... 5 SISÄLLYSLUETTELO JOHDANTO TILASTOLLISEEN PÄÄTTELYYN TODENNÄKÖISYYS...

r = n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit.

HAVAITUT JA ODOTETUT FREKVENSSIT

Sisällysluettelo LUKU I METODOLOGIAN PERUSTEET IHMISTIETEISSÄ ESIPUHE...III ESIPUHE KIRJAN TOISEEN PAINOKSEEN... VIII SISÄLLYSLUETTELO...

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

Väliestimointi (jatkoa) Heliövaara 1

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170

Jos nollahypoteesi pitää paikkansa on F-testisuuren jakautunut Fisherin F-jakauman mukaan

ABHELSINKI UNIVERSITY OF TECHNOLOGY

Mat Tilastollisen analyysin perusteet, kevät 2007

Sovellettu todennäköisyyslaskenta B

Harjoitus 7: NCSS - Tilastollinen analyysi

Mat Sovellettu todennäköisyyslasku A

Tutkimusongelmia ja tilastollisia hypoteeseja: Perunalastupussien keskimääräinen paino? Nollahypoteesi Vaihtoehtoinen hypoteesi (yksisuuntainen)

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu

Odotusarvoparien vertailu. Vilkkumaa / Kuusinen 1

Testejä suhdeasteikollisille muuttujille

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

11. laskuharjoituskierros, vko 15, ratkaisut

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1

Luentokalvoja tilastollisesta päättelystä. Kalvot laatinut Aki Taanila Päivitetty

Sovellettu todennäköisyyslaskenta B

Estimointi. Otantajakauma

Valitaan testisuure, jonka jakauma tunnetaan H 0 :n ollessa tosi.

Johdatus tilastotieteeseen Tilastolliset testit. TKK (c) Ilkka Mellin (2005) 1

Jos nyt on saatu havaintoarvot Ü ½ Ü Ò niin suurimman uskottavuuden

10. laskuharjoituskierros, vko 14, ratkaisut

Tilastotieteen jatkokurssi syksy 2003 Välikoe

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin

Aki Taanila TILASTOLLISEN PÄÄTTELYN ALKEET

χ = Mat Sovellettu todennäköisyyslasku 11. harjoitukset/ratkaisut

Sovellettu todennäköisyyslaskenta B

Estimointi. Luottamusvälin laskeminen keskiarvolle α/2 α/2 0.1

Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1

Kynä-paperi -harjoitukset. Taina Lehtinen Taina I Lehtinen Helsingin yliopisto

Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1

ALKUSANAT... 4 ALKUSANAT E-KIRJA VERSIOON... 5 SISÄLLYSLUETTELO... 6

5. Kahden tunnusluvun erotuksen merkitsevyys

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Sovellettu todennäköisyyslaskenta B

Kaavakokoelma, testikaaviot ja jakaumataulukot liitteinä. Ei omia taulukoita! Laskin sallittu.

1. Nollahypoteesi on, että teksti on kirjoitettu lyhyemmällä murteella. Mahdollisiavaihtoehtojaonvainyksieliettäteksti

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

¼ ¼ joten tulokset ovat muuttuneet ja nimenomaan huontontuneet eivätkä tulleet paremmiksi.

Mat Tilastollisen analyysin perusteet, kevät 2007

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

Tilastollinen testaaminen tai Tilastollinen päättely. Geneettinen analyysi

Mitä tarvitsee tietää biostatistiikasta ja miksi? Matti Uhari Lastentautien klinikka Oulun yliopisto

Hypoteesin testaus Alkeet

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

Tilastollisen analyysin perusteet Luento 6: Korrelaatio ja riippuvuus tilastotieteessä

Tilastolliset testit. Tilastolliset testit. Tilastolliset testit: Mitä opimme? 2/5. Tilastolliset testit: Mitä opimme? 1/5

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi. Viikko 5

Tilastollisen analyysin perusteet Luento 11: Epäparametrinen vastine ANOVAlle

Aineistokoko ja voima-analyysi

Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit

χ 2 -yhteensopivuustestissä käytetään χ 2 -testisuuretta χ = Mat Sovellettu todennäköisyyslasku A

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 6. luento. Pertti Palo

voidaan hylätä, pienempi vai suurempi kuin 1 %?

031021P Tilastomatematiikka (5 op) viikko 5

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit

Sisällysluettelo ESIPUHE 1. PAINOKSEEN... 3 ESIPUHE 2. PAINOKSEEN... 3 SISÄLLYSLUETTELO... 4

Mat Tilastollisen analyysin perusteet, kevät 2007

1. Tilastollinen malli??

Mat Tilastollisen analyysin perusteet, kevät 2007

SEM1, työpaja 2 ( )

2. TILASTOLLINEN TESTAAMINEN...

805306A Johdatus monimuuttujamenetelmiin, 5 op

Aki Taanila TILASTOLLISEN PÄÄTTELYN ALKEET

Sovellettu todennäköisyyslaskenta B

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Tilastollisia peruskäsitteitä ja Monte Carlo

voidaan hylätä, pienempi vai suurempi kuin 1 %?

Aki Taanila TILASTOLLISEN PÄÄTTELYN ALKEET

Ongelma: Poikkeaako perusjoukon suhteellinen osuus vertailuarvosta?

Sisällysluettelo SISÄLLYSLUETTELO...6 LYHYT SANASTO VASTA-ALKAJILLE JOHDATUS PARAMETRITTOMIIN MENETELMIIN...9

Matemaatikot ja tilastotieteilijät

Testit järjestysasteikollisille muuttujille

edellyttää valintaa takaisinpanolla Aritmeettinen keskiarvo Jos, ½ Ò muodostavat satunnaisotoksen :n jakaumasta niin Otosvarianssi Ë ¾

Tilastollisen analyysin perusteet Luento 4: Testi suhteelliselle osuudelle

TA7, Ekonometrian johdantokurssi HARJOITUS 4 1 RATKAISUEHDOTUKSET

Korrelaatiokertoinen määrittely 165

A130A0650-K Tilastollisen tutkimuksen perusteet 6 op Tentti / Anssi Tarkiainen & Maija Hujala

4 Riippuvuus 1. Esimerkki 4. Korrelaation laskeminen SPSS-ohjelmalla rajatusta aineistosta

MTTTP5, luento Otossuureita ja niiden jakaumia (jatkuu)

Testaa onko myrkkypitoisuus eri ryhmissä sama. RATK. Lasketaan kaikkien havaintoarvojen summa: k T i = = 486.

Aki Taanila TILASTOLLINEN PÄÄTTELY

Teema 9: Tilastollinen merkitsevyystestaus

1. Normaalisuuden tutkiminen, Bowmanin ja Shentonin testi, Rankit Plot, Wilkin ja Shapiron testi

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

Kertausluento. Tilastollinen päättely II - 2. kurssikoe

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Tavanomaisten otostunnuslukujen, odotusarvon luottamusvälin ja Box ja Whisker -kuvion määritelmät: ks. 1. harjoitukset.

RISKITASO. Riskitaso (α) määrittää virhepäätelmän todennäköisyyden. Käytettyjä riskitasoja:

Yhteensopivuuden, homogeenisuuden ja riippumattomuuden testaaminen

Johdatus varianssianalyysiin. Vilkkumaa / Kuusinen 1

Transkriptio:

Sisällysluettelo ESIPUHE KIRJAN 1. PAINOKSEEN...3 ESIPUHE KIRJAN 2. PAINOKSEEN...3 SISÄLLYSLUETTELO...4 1. JOHDANTO TILASTOLLISEEN PÄÄTTELYYN...6 1.1 INDUKTIO JA DEDUKTIO...7 1.2 SYYT JA VAIKUTUKSET...9 2. TODENNÄKÖISYYS...12 2.1 MERKINTÖJÄ...13 2.2 KLASSINEN TODENNÄKÖISYYS...13 2.3 TODENNÄKÖISYYDEN FREKVENSSITULKINTA...14 2.4 TODENNÄKÖISYYDEN OMINAISUUKSIA...15 2.5 TODENNÄKÖISYYS JA P-ARVO...17 2.6 TODENNÄKÖISYYS JA PINTA-ALATULKINTA...19 3. OTANTAJAKAUMAT JA NIIDEN KÄYTTÖ...20 3.1 EPÄJATKUVIA JAKAUMIA...21 3.2 NORMAALIJAKAUMA...22 3.3 T-JAKAUMA JA χ 2 -JAKAUMA...25 4. HYPOTEESIEN TESTAAMINEN...27 4.1 TESTATTAVA HYPOTEESI...27 4.2 HYPOTEESI MATEMAATTISESSA MUODOSSA...28 4.3 PÄÄTÖSTEORIA JA TESTISUURE...30 4.4 KIINTEÄN P-ARVON KÄYTTÖ...33 4.5 P-ARVON ETSIMINEN TAULUKOSTA JA TIETOKONEELLA...34 Kiinteä p-arvo taulukossa...34 Havaittu p-arvo laskentataulukko-ohjelmassa...35 4.6 MERKITTÄVYYS JA MERKITSEVYYS...37 5. JAKAUMIA HYÖDYNTÄVIÄ TESTEJÄ...40 5.1 χ 2 RIIPPUMATTOMUUSTESTIN TULKINTA...40 5.2 KORRELAATION MERKITSEVYYS...42 5.3 KAHDEN KORRELAATION ERON MERKITSEVYYS...43 5.4 T-TESTIN TULKINTA...45 5.4 PIENI OTOSKOKO JA JAKAUMAOLETUS...47 TEHTÄVIÄ...48 6. LUOTTAMUSVÄLI JA SEN LASKEMINEN...49 6.1 LUOTTAMUSVÄLIN LASKEMINEN...49 6.2 ESIMERKKI LUOTTAMUSVÄLIN LASKEMISESTA...51 6.3 CRONBACHIN ALFA JA SEN LUOTTAMUSVÄLIN LASKEMINEN...51 Alfan luottamusvälin laskemisen tekniikka...52 4

Kriittiset pisteet ja luottamusväli SPSS -ohjelmistolla...54 Kriittiset pisteet ja luottamusväli Excel-laskentataulukolla...57 Kriittiset pisteet ja luottamusväli SURVO 98C ohjelmistolla...59 Alfan luottamusväli ja erilaiset otoskoot...60 Johtopäätöksiä alfan luottamusvälistä...61 7. TULOSTEN TARKASTELU JA POHDINTA...63 7.1 MATEMATIIKKA JA TULKINNAT...63 7.2 TULOKSET JA TULKINNAT...64 7.3 SUOSITUKSET JA TULKINNAT...64 8. LOPUKSI...66 LÄHTEET...67 ASIA- JA HENKILÖHAKEMISTO...69 TAULUKOT...71 5

teella päätellä, pitäisikö nollahypoteesi hylätä vai saako nollahypoteesi tukea. Kiinteää p-arvoa etsittäessä taulukosta tarvitaan kaksi tietoa: 1. Millä riskitasolla päätelmä tehdään, eli mikä on valittu p-arvo. 2. Mikä on vapausaste eli degrees of freedom, lyhyemmin df. Jos otamme esimerkiksi Tilastollisen kuvauksen perusteet kirjassa esitetyn ristiintaulukon analyysin yhteydessä saadun χ 2 testiarvon 2.727, tiedämme samalla myös vapausasteet. Ristiintaulukkomme oli 2x2 taulukko, joten tarvitsemamme vapausaste on 1, joka merkitään df=1. Tämä yleensä ilmaistaan myös itse χ 2 testiarvon merkinnässä, joka tarkalleen ottaen pitäisi merkitä χ 2 (1), jossa suluissa oleva 1 viittaa vapausasteisiin. Valitsemme kaksisuuntaiseksi riskitasoksi 5 % eli 0.05. Näin ollen χ 2 taulukon avulla voimme päätellä edustaako saamamme testisuureen arvo 2.727 niin harvinaista tapausta jakaumassa, että H o joudutaan hylkäämään. Kriittinen piste luetaan taulukosta siitä risteyspisteestä, jossa kohtaavat yhden vapausasteen rivi ja 0.05 arvon sarake. p-arvo = 0.05 Vapausaste=1 df 0.1 0.05 0.01 0.001 1 2.706 3.841 6.635 10.828 2 4.605 5.991 9.210 13.816 3 6.251 7.815 11.345 16.266 4 7.779 9.488 13.277 18.467 5 9.236 11.070 15.086 20.515 6 10.645 12.592 16.812 22.458 7 12 017 14 067 18 475 24 322 Kriittinen piste on 3.841. Tätä arvoa suurempia arvoja (mukaan lukien itse arvo) on siis tuon muotoisessa χ 2 jakaumassa 5 %. Nyt saamamme χ 2 arvo 2.727 on pienempi kuin ko. kriittinen piste, joten emme voi hylätä nollahypoteesia. Havaittu p-arvo laskentataulukko-ohjelmassa Nykyisin lienee helpompi etsiä havaittuja p-arvoja tietokoneella kuin taulukkokirjoista selaillen. Havaittu p-arvo on tar- 35

kempi mitta kuin kiinteä p-arvo. Jo aiemmin olemme todenneet, ettei mikään järkeilyperuste puolla kiinteän p-arvon käyttöä kuin erikoistilanteissa. Excel-taulukkolaskentaohjelmassa havaittu p-arvo haetaan seuraavasti. Missä hyvänsä taulukon ruudussa kaksoisklikataan ruutua ja kirjoitetaan = -merkki ja etsitään funktionäppäin painike tai Lisää Funktio komento. Funktionäppäin Funktionäppäimen painamisen jälkeen avautuu ikkuna, josta valitaan sopiva jakauma: χ 2 jakauma löytyy nimellä CHIJA- KAUMA, t-jakauma löytyy nimellä TJAKAUMA ja f- jakauma nimellä FJAKAUMA. 36

Ikkunan alareunassa kerrotaan että tarvitaan kaksi arvoa: X ja Vapausasteet. Luvuista X viittaa testisuureen arvoon (2.727) ja toinen nimensä mukaiseen vapausasteeseen (1). OKnäppäintä painamalla pääsemme antamaan kyseiset arvot ja saamme khiin neliö -jakauman todennäköisyyden. Taulukko kertookin meille jo tässä vaiheessa, että ko. pisteen ja sitä suurempien arvojen todennäköisyys on 0.0987. Huomattakoon, että luvussa 2.727 on käytettävä pilkkua, jotta Excel ymmärtäisi sen numeroksi. OK-näppäintä painamalla saamme havaitun p-arvon Excel taulukkoon: Vastaavalla tavalla saamme tietenkin t-jakauman arvoille p- arvot. t-jakauman yhteydessä on tosin huomattava, että on valittava myös se, onko testauksemme yksi- vai kaksisuuntainen. 4.6 Merkittävyys ja merkitsevyys Lukija on tullut tutuksi termin merkitsevä kanssa. Maininta poikien ja tyttöjen välillä oli merkitsevä ero tarkoittaa, että tyttöjen ja poikien välillä on todellista eroa. Sanonta korrelaatio oli merkitsevästi nollasta poikkeava tarkoittaa vastaavasti, että korrelaatiokertoimen arvo eroaa luotettavasti 37