Yhden otoksen suhteellisen osuuden testaus Ongelma: Poikkeaako perusjoukon suhteellinen osuus vertailuarvosta? Hypoteesit H 0 : p = p 0 H 1 : p p 0 tai H 1 : p > p 0 tai H 1 : p < p 0 Suhteellinen osuus on sama kuin vertailuarvo Suhteellinen osuus poikkeaa vertailuarvosta Suhteellinen osuus on suurempi kuin vertailuarvo Suhteellinen osuus on suurempi kuin vertailuarvo Oletukset 1) Käytössä on riippumaton otos perusjoukosta. 2) Jokaisella havainnolla on yhtä suuri havainnointitodennäköisyys. 3) Odotetut frekvenssit, np 0 ja n[1 p 0 ], ovat suurempia kuin 5. Riskitaso α: 0.05, 0.01, 0.001 Testisuure ja p-arvo z X np 0 = ~ N(0, 1), np0 ( 1 p0 ) ja X: kiinnostuksen kohteena oleva havaittu frekvenssi, p 0 : suhteellisena osuutena ilmoitettu vertailuarvo, n: otoskoko. Johtopäätökset Jos p > α, nollahypoteesia ei hylätä. Jos p < α, nollahypoteesi hylätään.
Esimerkki. Automerkin ABC markkinaosuus vuonna 1997 oli 16.3 %. Seuraavan vuoden kolmen ensimmäisen kuukauden aikana myytiin kaikkiaan 21 754 autoa, joista ABC-merkkisiä oli 3 269. Onko automerkin ABC markkinaosuus muuttunut? Arvioidaan tätä yhden suhteellisen osuuden testillä. Hypoteesit H 0 : p = p 0 H 1 : p p 0 Markkinaosuus ei ole muuttunut. Markkinaosuus on muuttunut. Oletukset Tapahtuma: ostaako ABC-auton vai ei. Tässä voidaan kyseenalaistaa satunnaisuus: Onko päätös ostaa jokin tietty automerkki satunnainen? Onko vuoden kolme ensimmäistä kuukautta satunnaisotos koko myynnistä? Odotetut frekvenssit: np 0 = 21754 0.163 = 3546, n(1 p 0 ) = 21754 (1 0.163) = 18208. Riskitaso α = 0.01 Testisuure ja p-arvo Havaittu frekvenssi: X = 3269 (X / n = 15.0 %) Odotettu frekvenssi: ks. ed. z = X np np 0 1 p 0 ( 0 ) = 3269 21754 0.163 21754 0.163 (1 0.163) 276.90 = = 5.083 54.4786 p = 3.7198 10-7 = 0.00000037198 Johtopäätös Nollahypoteesi siis hylätään ja sanotaan markkinaosuuden muuttuneen tässä sen todetaan laskeneen (p < 0.001) jos satunnaisuusoletus voidaan tehdä.
Tunnuslukumuodossa olevan aineiston analysointi 1. Syötetään aineisto (kaksi muuttujaa): x: 0 1 n: 3269 18485 2. Määritetään oikea tapausmäärä analysoitavalle muuttujalle käyttämällä painotusta Data/Weight Cases... Weight cases by: Frequency variable: n
3. Suoritetaan analyysi Analyze/Nonparametric tests/chi Square... Test Variable list: sp Expected values: Values:,163,837
NPar Tests [DataSet0] Chi-Square Test Frequencies x,00 1,00 Total Observed N Expected N Residual 3269 3545,9-276,9 18485 18208,1 276,9 21754 Test Statistics Chi-Square a df Asymp. Sig. x 25,834 1,000 a. 0 cells (,0%) have expected frequencies less than 5. The minimum expected cell frequency is 3545,9. Testisuure ja p-arvo χ 2 = 25.834 (vrt. z 2 = -5.083 2 = 25.834) df = 1 p = 3.7198 10-7 = 0.00000037198 Nollahypoteesi siis hylätään ja sanotaan markkinaosuuden muuttuneen (p < 0.001).
Kahden otoksen suhteellisen osuuden testaus Ongelma: Onko suhteellinen osuus sama kahdessa perusjoukossa? Hypoteesit H 0 : P 1 = P 2 H 1 : P 1 P 2 tai H 1 : P 1 > P 2 tai H 1 : P 1 < P 2 Suhteelliset osuudet ovat samat. Suhteelliset osuudet eivät ole samat. Suhteellinen osuus on suurempi ensimmäisessä ryhmässä Suhteellinen osuus on suurempi toisessa ryhmässä Oletukset Käytössä on riippumattomat otokset perusjoukoista ja ryhmät ovat toisistaan riippumattomia. Jokaisella yksittäisellä tapauksella on yhtä suuri tapahtumatodennäköisyys. Molemmissa ryhmissä odotetut frekvenssit (n i P i ja n i [1 P i ], i = 1,2) ovat suurempia kuin 5. Riskitaso α: 0.05, 0.01, 0.001 Testisuure ja p-arvo P = (n 1 P 1 + n 2 P 2 )/(n 1 + n 2 ) z P P 1 2 = ~ N(0, 1) Johtopäätökset P( 1 P)(1/ n1 1/ n2 ) Jos p > α, nollahypoteesia ei hylätä. Jos p < α, nollahypoteesi hylätään.
Esimerkki. Tutkimuksessa haluttiin selvittää ikääntyneiden naisten ja miesten tupakointia. Poimittiin satunnaisotannalla haastatteluun 759 henkilöä (342 miestä ja 417 naista). Miehistä tupakoivan havaittiin 166 ja naisissa 187. Onko ryhmissä suhteellinen osuus sama? Hypoteesit H 0 : P 1 = P 2 H 1 : P 1 P 2 Suhteelliset osuudet ovat samat. Suhteelliset osuudet eivät ole samat. Oletukset Satunnaisuus ja riippumattomuus näyttäisivät olevan kunnossa. Oletetaan tapahtuma jälleen satunnaiseksi. Odotetut frekvenssit: n 1 P 1 = 342 (166 + 187) / 759 = 159 n 1 (1 P 1 ) = 342 (342 166 + 417 187) /759 = 183 n 2 P 2 = 417 (166 + 187) / 759 = 194 n 2 (1 P 2 ) = 417 (342 166 + 417 187) / 759 = 223 Huom. Nämä ovat samat kuin ristiintaulukosta laskettaessa. Riskitaso α = 0.01 Testisuure ja p-arvo P 1 = 166 / 342 = 0.485 P 2 = 187 / 417 = 0.448 P = (n 1 P 1 + n 2 P 2 )/(n 1 + n 2 ) = (342 0.485 + 417 0.448)/(342 + 417) = (116 + 187) / 759 = 0.465 z = P P 1 P( 1 P)(1/ n1 1/ n2 ) 2 = 0.485 0.448 0.465(1 0.465)(1/ 342 + 1/ 417) = 1.015 p = 0.3100 Johtopäätökset Nollahypoteesi jää voimaan. Suhteellisia osuuksia pidetään perusjoukon tasolla yhtä suurina (p = 0.310).
Tunnuslukumuodossa olevan aineiston analysointi 1. Syötetään aineisto (kaksi muuttujaa): x: 0 0 1 1 y: 0 1 0 1 n: 176 166 230 187 2. Määritetään oikea tapausmäärä analysoitavalle muuttujalle käyttämällä painotusta. Data/Weight Cases... Weight cases by: Frequency variable: n
3. Suoritetaan analyysi Analyze/Descriptive statistics/crosstabs...
Row: Column: x y Statistics: Chi-square (continue)
Cells : Counts: Observed, Expected, Percentages: Row (continue)
Crosstabs [DataSet0] Case Processing Summary sp * smoke Cases Valid Missing Total N Percent N Percent N Percent 759 100,0% 0,0% 759 100,0% sp * smoke Crosstabulation sp Total,00 1,00 Count Expected Count % within sp Count Expected Count % within sp Count Expected Count % within sp smoke,00 1,00 Total 176 166 342 182,9 159,1 342,0 51,5% 48,5% 100,0% 230 187 417 223,1 193,9 417,0 55,2% 44,8% 100,0% 406 353 759 406,0 353,0 759,0 53,5% 46,5% 100,0% Chi-Square Tests Pearson Chi-Square Continuity Correction a Likelihood Ratio Fisher's Exact Test Linear-by-Linear Association N of Valid Cases Asymp. Sig. Value df (2-sided) 1,031 b 1,310,887 1,346 1,030 1,310 1,029 1,310 759 a. Computed only for a 2x2 table Exact Sig. (2-sided) Exact Sig. (1-sided),342,173 b. 0 cells (,0%) have expected count less than 5. The minimum expected count is 159,06. Kahden suhteellisen osuuden testaus vastaa siis 2 2 kokoisen taulukon testaamista χ 2 -testillä. Huom. z 2 = 1.015 2 = 1.031.