Ongelma: Poikkeaako perusjoukon suhteellinen osuus vertailuarvosta?

Samankaltaiset tiedostot
voidaan hylätä, pienempi vai suurempi kuin 1 %?

voidaan hylätä, pienempi vai suurempi kuin 1 %?

OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi Luento 2

r = n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit.

1 Johdanto 2. 2 Aineistot 2. 3 Henkilöstön koulutustausta ja työkokemus 3. 4 Aikuissosiaalityön sisältö 5. 5 Henkilöstön osaaminen 12

1. a) Luettele hyvän kvantitatiivisen tutkimuksen perusvaatimukset. b) Miten tutkimusraportissa arvioit tutkimuksen luotettavuutta?

RISTIINTAULUKOINTI JA Χ 2 -TESTI

BIOSTATISTIIKKAA ESIMERKKIEN AVULLA. Kurssimoniste (luku 3) Janne Pitkäniemi. Helsingin Yliopisto Kansanterveystieteen laitos

1. Normaalisuuden tutkiminen, Bowmanin ja Shentonin testi, Rankit Plot, Wilkin ja Shapiron testi

HAVAITUT JA ODOTETUT FREKVENSSIT

Testit laatueroasteikollisille muuttujille

806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy (1 α) = 99 1 α = 0.

Mediaanikorko on kiinteäkorkoiselle lainalle korkeampi. Tämä hypoteesi vastaa taloustieteen käsitystä korkojen määräytymismekanismista.

Väliestimointi (jatkoa) Heliövaara 1

Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen., jos otoskeskiarvo on suurempi kuin 13,96. Mikä on testissä käytetty α:n arvo?

Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit

Mat Tilastollisen analyysin perusteet, kevät 2007

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

BIOSTATISTIIKKAA ESIMERKKIEN AVULLA. Kurssimoniste (luku 4) Janne Pitkäniemi. Helsingin Yliopisto Kansanterveystieteen laitos

Frequencies. Frequency Table

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Ratkaisuja luvun 15 tehtäviin

Mat Tilastollisen analyysin perusteet, kevät 2007

Tilastollisen analyysin perusteet Luento 4: Testi suhteelliselle osuudelle

Testit järjestysasteikollisille muuttujille

Sovellettu todennäköisyyslaskenta B

Tavanomaisten otostunnuslukujen, odotusarvon luottamusvälin ja Box ja Whisker -kuvion määritelmät: ks. 1. harjoitukset.

Tulkitse tulokset. Onko muuttujien välillä riippuvuutta? Jos riippuvuutta on, niin millaista se on?

Tutkimus peliohjaimen käytöstä Super Smash Bros. Melee pelissä. Aleksanteri Karanka

Demotehtävä + liitteet (muuttujaluettelo, käytettävät analyysimenetelmät hypoteeseineen, osa SPSS-ohjelman tulostuslistasta)

ABHELSINKI UNIVERSITY OF TECHNOLOGY

Estimointi. Luottamusvälin laskeminen keskiarvolle α/2 α/2 0.1

Testejä suhdeasteikollisille muuttujille

Kvantitatiiviset tutkimusmenetelmät maantieteessä

Sovellettu todennäköisyyslaskenta B

Muuttujien väliset riippuvuudet esimerkkejä

Estimointi. Otantajakauma

Mat Tilastollisen analyysin perusteet, kevät 2007

Sisällysluettelo SISÄLLYSLUETTELO...6 LYHYT SANASTO VASTA-ALKAJILLE JOHDATUS PARAMETRITTOMIIN MENETELMIIN...9

Sovellettu todennäköisyyslaskenta B

¼ ¼ joten tulokset ovat muuttuneet ja nimenomaan huontontuneet eivätkä tulleet paremmiksi.

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

11. laskuharjoituskierros, vko 15, ratkaisut

Valitaan testisuure, jonka jakauma tunnetaan H 0 :n ollessa tosi.

Tilastollisen analyysin perusteet Luento 11: Epäparametrinen vastine ANOVAlle

MTTTP5, luento Luottamusväli, määritelmä

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSOPAS. SPSS-opas

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu

Sovellettu todennäköisyyslaskenta B

SPSS-pikaohje. Jukka Jauhiainen OAMK / Tekniikan yksikkö

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

A130A0650-K Tilastollisen tutkimuksen perusteet 6 op Tentti / Anssi Tarkiainen & Maija Hujala

1. PÄÄTTELY YHDEN SELITTÄJÄN LINEAARISESTA REGRESSIOMALLISTA

Sisällysluettelo ESIPUHE... 4 ALKUSANAT E-KIRJA VERSIOON... 5 SISÄLLYSLUETTELO JOHDANTO TILASTOLLISEEN PÄÄTTELYYN TODENNÄKÖISYYS...

Harjoittele tulkintoja

Otoskoko 107 kpl. a) 27 b) 2654

Tutkimusongelmia ja tilastollisia hypoteeseja: Perunalastupussien keskimääräinen paino? Nollahypoteesi Vaihtoehtoinen hypoteesi (yksisuuntainen)

Harjoitus 7: NCSS - Tilastollinen analyysi

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu

MTTTP5, luento Kahden jakauman sijainnin vertailu (jatkoa) Tutkimustilanteita y = neliöhinta x = sijainti (2 aluetta)

pisteet Frekvenssi frekvenssi Yhteensä

Mat Tilastollisen analyysin perusteet. Testit suhdeasteikollisille muuttujille. Avainsanat:

Tilastollinen testaaminen tai Tilastollinen päättely. Geneettinen analyysi

10. laskuharjoituskierros, vko 14, ratkaisut

Sovellettu todennäköisyyslaskenta B

Jos nollahypoteesi pitää paikkansa on F-testisuuren jakautunut Fisherin F-jakauman mukaan

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1

KAHDEN RYHMÄN VERTAILU

χ = Mat Sovellettu todennäköisyyslasku 11. harjoitukset/ratkaisut

Tilastollisen analyysin perusteet Luento 5: Jakaumaoletuksien. testaaminen

Mat Sovellettu todennäköisyyslasku A

Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit

Luentokalvoja tilastollisesta päättelystä. Kalvot laatinut Aki Taanila Päivitetty


Data-analyysi II. Sisällysluettelo. Simo Kolppo [Type the document subtitle]

2. Aineiston kuvailua

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

2. TILASTOLLINEN TESTAAMINEN...

1. Nollahypoteesi on, että teksti on kirjoitettu lyhyemmällä murteella. Mahdollisiavaihtoehtojaonvainyksieliettäteksti

Sisällysluettelo ESIPUHE KIRJAN 1. PAINOKSEEN...3 ESIPUHE KIRJAN 2. PAINOKSEEN...3 SISÄLLYSLUETTELO...4

edellyttää valintaa takaisinpanolla Aritmeettinen keskiarvo Jos, ½ Ò muodostavat satunnaisotoksen :n jakaumasta niin Otosvarianssi Ë ¾

1. KAKSISUUNTAINEN VARIANSSIANALYYSI: TULOSTEN TULKINTA

Lumipallo regressioanalyysista. Logistinen regressioanalyysi. Soveltuvan menetelmän valinta. Regressioanalyysi. Logistinen regressioanalyysi I

xi = yi = 586 Korrelaatiokerroin r: SS xy = x i y i ( x i ) ( y i )/n = SS xx = x 2 i ( x i ) 2 /n =

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

Johdatus varianssianalyysiin. Vilkkumaa / Kuusinen 1

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

RISKITASO. Riskitaso (α) määrittää virhepäätelmän todennäköisyyden. Käytettyjä riskitasoja:

Tilastotieteen jatkokurssi syksy 2003 Välikoe

JY / METODIFESTIVAALI 2013 PRE-KURSSI: KYSELYTUTKIMUS DEMOT

Raija Leppälä. Ohjeita tilastollisen tutkimuksen toteuttamiseksi IBM SPSS Statistics -ohjelmiston avulla

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi. Viikko 5

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt: Mitä opimme? Latinalaiset neliöt

Kaavakokoelma, testikaaviot ja jakaumataulukot liitteinä. Ei omia taulukoita! Laskin sallittu.

Transkriptio:

Yhden otoksen suhteellisen osuuden testaus Ongelma: Poikkeaako perusjoukon suhteellinen osuus vertailuarvosta? Hypoteesit H 0 : p = p 0 H 1 : p p 0 tai H 1 : p > p 0 tai H 1 : p < p 0 Suhteellinen osuus on sama kuin vertailuarvo Suhteellinen osuus poikkeaa vertailuarvosta Suhteellinen osuus on suurempi kuin vertailuarvo Suhteellinen osuus on suurempi kuin vertailuarvo Oletukset 1) Käytössä on riippumaton otos perusjoukosta. 2) Jokaisella havainnolla on yhtä suuri havainnointitodennäköisyys. 3) Odotetut frekvenssit, np 0 ja n[1 p 0 ], ovat suurempia kuin 5. Riskitaso α: 0.05, 0.01, 0.001 Testisuure ja p-arvo z X np 0 = ~ N(0, 1), np0 ( 1 p0 ) ja X: kiinnostuksen kohteena oleva havaittu frekvenssi, p 0 : suhteellisena osuutena ilmoitettu vertailuarvo, n: otoskoko. Johtopäätökset Jos p > α, nollahypoteesia ei hylätä. Jos p < α, nollahypoteesi hylätään.

Esimerkki. Automerkin ABC markkinaosuus vuonna 1997 oli 16.3 %. Seuraavan vuoden kolmen ensimmäisen kuukauden aikana myytiin kaikkiaan 21 754 autoa, joista ABC-merkkisiä oli 3 269. Onko automerkin ABC markkinaosuus muuttunut? Arvioidaan tätä yhden suhteellisen osuuden testillä. Hypoteesit H 0 : p = p 0 H 1 : p p 0 Markkinaosuus ei ole muuttunut. Markkinaosuus on muuttunut. Oletukset Tapahtuma: ostaako ABC-auton vai ei. Tässä voidaan kyseenalaistaa satunnaisuus: Onko päätös ostaa jokin tietty automerkki satunnainen? Onko vuoden kolme ensimmäistä kuukautta satunnaisotos koko myynnistä? Odotetut frekvenssit: np 0 = 21754 0.163 = 3546, n(1 p 0 ) = 21754 (1 0.163) = 18208. Riskitaso α = 0.01 Testisuure ja p-arvo Havaittu frekvenssi: X = 3269 (X / n = 15.0 %) Odotettu frekvenssi: ks. ed. z = X np np 0 1 p 0 ( 0 ) = 3269 21754 0.163 21754 0.163 (1 0.163) 276.90 = = 5.083 54.4786 p = 3.7198 10-7 = 0.00000037198 Johtopäätös Nollahypoteesi siis hylätään ja sanotaan markkinaosuuden muuttuneen tässä sen todetaan laskeneen (p < 0.001) jos satunnaisuusoletus voidaan tehdä.

Tunnuslukumuodossa olevan aineiston analysointi 1. Syötetään aineisto (kaksi muuttujaa): x: 0 1 n: 3269 18485 2. Määritetään oikea tapausmäärä analysoitavalle muuttujalle käyttämällä painotusta Data/Weight Cases... Weight cases by: Frequency variable: n

3. Suoritetaan analyysi Analyze/Nonparametric tests/chi Square... Test Variable list: sp Expected values: Values:,163,837

NPar Tests [DataSet0] Chi-Square Test Frequencies x,00 1,00 Total Observed N Expected N Residual 3269 3545,9-276,9 18485 18208,1 276,9 21754 Test Statistics Chi-Square a df Asymp. Sig. x 25,834 1,000 a. 0 cells (,0%) have expected frequencies less than 5. The minimum expected cell frequency is 3545,9. Testisuure ja p-arvo χ 2 = 25.834 (vrt. z 2 = -5.083 2 = 25.834) df = 1 p = 3.7198 10-7 = 0.00000037198 Nollahypoteesi siis hylätään ja sanotaan markkinaosuuden muuttuneen (p < 0.001).

Kahden otoksen suhteellisen osuuden testaus Ongelma: Onko suhteellinen osuus sama kahdessa perusjoukossa? Hypoteesit H 0 : P 1 = P 2 H 1 : P 1 P 2 tai H 1 : P 1 > P 2 tai H 1 : P 1 < P 2 Suhteelliset osuudet ovat samat. Suhteelliset osuudet eivät ole samat. Suhteellinen osuus on suurempi ensimmäisessä ryhmässä Suhteellinen osuus on suurempi toisessa ryhmässä Oletukset Käytössä on riippumattomat otokset perusjoukoista ja ryhmät ovat toisistaan riippumattomia. Jokaisella yksittäisellä tapauksella on yhtä suuri tapahtumatodennäköisyys. Molemmissa ryhmissä odotetut frekvenssit (n i P i ja n i [1 P i ], i = 1,2) ovat suurempia kuin 5. Riskitaso α: 0.05, 0.01, 0.001 Testisuure ja p-arvo P = (n 1 P 1 + n 2 P 2 )/(n 1 + n 2 ) z P P 1 2 = ~ N(0, 1) Johtopäätökset P( 1 P)(1/ n1 1/ n2 ) Jos p > α, nollahypoteesia ei hylätä. Jos p < α, nollahypoteesi hylätään.

Esimerkki. Tutkimuksessa haluttiin selvittää ikääntyneiden naisten ja miesten tupakointia. Poimittiin satunnaisotannalla haastatteluun 759 henkilöä (342 miestä ja 417 naista). Miehistä tupakoivan havaittiin 166 ja naisissa 187. Onko ryhmissä suhteellinen osuus sama? Hypoteesit H 0 : P 1 = P 2 H 1 : P 1 P 2 Suhteelliset osuudet ovat samat. Suhteelliset osuudet eivät ole samat. Oletukset Satunnaisuus ja riippumattomuus näyttäisivät olevan kunnossa. Oletetaan tapahtuma jälleen satunnaiseksi. Odotetut frekvenssit: n 1 P 1 = 342 (166 + 187) / 759 = 159 n 1 (1 P 1 ) = 342 (342 166 + 417 187) /759 = 183 n 2 P 2 = 417 (166 + 187) / 759 = 194 n 2 (1 P 2 ) = 417 (342 166 + 417 187) / 759 = 223 Huom. Nämä ovat samat kuin ristiintaulukosta laskettaessa. Riskitaso α = 0.01 Testisuure ja p-arvo P 1 = 166 / 342 = 0.485 P 2 = 187 / 417 = 0.448 P = (n 1 P 1 + n 2 P 2 )/(n 1 + n 2 ) = (342 0.485 + 417 0.448)/(342 + 417) = (116 + 187) / 759 = 0.465 z = P P 1 P( 1 P)(1/ n1 1/ n2 ) 2 = 0.485 0.448 0.465(1 0.465)(1/ 342 + 1/ 417) = 1.015 p = 0.3100 Johtopäätökset Nollahypoteesi jää voimaan. Suhteellisia osuuksia pidetään perusjoukon tasolla yhtä suurina (p = 0.310).

Tunnuslukumuodossa olevan aineiston analysointi 1. Syötetään aineisto (kaksi muuttujaa): x: 0 0 1 1 y: 0 1 0 1 n: 176 166 230 187 2. Määritetään oikea tapausmäärä analysoitavalle muuttujalle käyttämällä painotusta. Data/Weight Cases... Weight cases by: Frequency variable: n

3. Suoritetaan analyysi Analyze/Descriptive statistics/crosstabs...

Row: Column: x y Statistics: Chi-square (continue)

Cells : Counts: Observed, Expected, Percentages: Row (continue)

Crosstabs [DataSet0] Case Processing Summary sp * smoke Cases Valid Missing Total N Percent N Percent N Percent 759 100,0% 0,0% 759 100,0% sp * smoke Crosstabulation sp Total,00 1,00 Count Expected Count % within sp Count Expected Count % within sp Count Expected Count % within sp smoke,00 1,00 Total 176 166 342 182,9 159,1 342,0 51,5% 48,5% 100,0% 230 187 417 223,1 193,9 417,0 55,2% 44,8% 100,0% 406 353 759 406,0 353,0 759,0 53,5% 46,5% 100,0% Chi-Square Tests Pearson Chi-Square Continuity Correction a Likelihood Ratio Fisher's Exact Test Linear-by-Linear Association N of Valid Cases Asymp. Sig. Value df (2-sided) 1,031 b 1,310,887 1,346 1,030 1,310 1,029 1,310 759 a. Computed only for a 2x2 table Exact Sig. (2-sided) Exact Sig. (1-sided),342,173 b. 0 cells (,0%) have expected count less than 5. The minimum expected count is 159,06. Kahden suhteellisen osuuden testaus vastaa siis 2 2 kokoisen taulukon testaamista χ 2 -testillä. Huom. z 2 = 1.015 2 = 1.031.