TKK / Systeemianalyysin laboratorio Mat-.090 Sovellettu todennäköisyyslasku A Harjoitus 11 (vko 48/003) (Aihe: Tilastollisia testejä, Laininen luvut 4.9, 15.1-15.4, 15.7) Nordlund 1. Kemiallisen prosessin saanto X on normaalijakautunut. Tehdas pyrkii pitämään prosessin saannon tasolla 70 %. Poimitaan yksinkertainen satunnaisotos saannosta ja saadaan havaintoarvot (yksikkönä %): 68. 67.5 70. 66.7 69.0 69.7 Poikkeaako saanto tavoitearvosta 70 %? Testaa 5 %:n merkitsevyystasolla, kun a) tiedetään, että X:n keskihajonta on prosenttiyksikköä. b) X:n keskihajontaa ei tunneta. (otoskeskiarvo x = 68.55 ja otosvarianssi s = 1.779 ). Muuttuvatko tulokset, jos merkitsevyystasoksi valitaankin 1 %? Merkitsevyystasosta (engl. significance level) käytetään myös termiä riskitaso. a) Halutaan testata normaalijakauman odotusarvoparametria. Nollahypoteesi: H 0 : µ = 70 (eli saannon odotusarvo on 70 %) Vaihtoehtoinen hypoteesi (tai vastahypoteesi): H 1 : µ 70 (eli saannon odotusarvo poikkeaa tavoitearvosta 70 %) Jos nollahypoteesi hylätään, vaihtoehtoinen hypoteesi hyväksytään. Tässä testissä käytetään nk. kaksisuuntaista vaihtoehtoista hypoteesia. Testisuureena käytetään ns. Z-testisuuretta, joka noudattaa nollahypoteesin pätiessä standardoitua normaalijakaumaa N(0, 1): X µ Z = ~ H 0 N(0,1) σ / n Nollahypoteesin pätiessä testisuureen odotusarvo eli normaaliarvo on 0 ja testisuureen itseisarvoltaan suuret arvot viittaavat siihen, että nollahypoteesi ei päde. 68.55 70 z = 1.77 / 6 Testisuureen P-arvo saadaan normaalijakauman taulukosta: ( Z ) ( Z ) ( Z ) ( Z ) P 1.77 = P 1.77 + P 1.77 = P 1.77 = 0.0384 = 0.0768 P-arvon sanallinen tulkinta: todennäköisyys saada nollahypoteesin pätiessä otos, joka poikkeaa itseisarvoltaan vähintään havaitun verran nollahypoteesin mukaisesta arvosta.
Koska P-arvo on suurempi kuin valittu merkitsevyystaso 5 %, nollahypoteesi jää voimaan. Tämä tarkoittaa, että havainnot eivät poikkea tilastollisesti merkitsevästi nollahypoteesin mukaisesta arvosta, ja tämän perusteella on mahdollista, että prosessin saannon odotusarvo on 70 %. Jos merkitsevyystasoksi valitaan 1 %, testin tulos ei muutu eli nollahypoteesi jää edelleen voimaan (P-arvo on suurempi kuin merkitsevyystaso). Toinen tapa Koska useimmille testeille ei ole mahdollista lukea P-arvoa taulukoista (ainakaan käyttökelpoisella tarkuudella), testistä tehtävät johtopäätökset joudutaan perustamaan nk. kriittisiin rajoihin (myös termejä kriittinen arvo ja hylkäysraja käytetään). Tällöin testi tehdään seuraavalla tavalla: H 0 : µ = 70 H 1 : µ 70 68.55 70 z = 1.77 / 6 Käytettävä merkitsevyystaso α = 0.05 ja koska vaihtoehtoinen hypoteesi on kaksisuuntainen, hylkäysalue jaetaan N(0, 1) jakauman hännille. Normaalijakauman taulukosta luetaan kriittiset rajat siten, että jakauman kummallekin hännälle jää todennäköisyys α/ = 0.05 ts. P(Z z α/ ) = α/ ja P(Z z α/ ) = α/. Kriittiset rajat ovat ± 1.96. Koska testisuureen laskettu arvo on kriittisten rajojen välissä, nollahypoteesi jää voimaan 5 %:n merkitsevyystasolla. Prosessin saanto ei siis poikkea tilastollisesti merkitsevästi tavoitearvosta 70 %. On siis mahdollista, että havaintojen poikkeama tavoitearvosta johtuu satunnaisvaihtelusta. Jos merkitsevyystasoksi otetaan 1 %, kriittiset rajat muuttuvat. Tällöin kriittisiksi rajoiksi saadaan taulukosta ±.576. Testin tulos ei muutu. P-arvojen käyttäminen on "oikea" tapa tehdä tilastollisia testejä. P-arvo sisältää enemmän informaatiota kuin kriittiset rajat ja testisuureen laskettu arvo. Koska kurssilla joudutaan tukeutumaan taulukoihin, joudutaan useimmissa tapauksissa tyytymään lasketun testisuureen ja merkitsevyystason sekä vaihtoehtoisen hypoteesin määräämien kriittisten rajojen vertailuun. Kaikki tilastollisia testejä tekevät tietokoneohjelmat tulostavat testeille P-arvon ja on tutkijan päätettävissä, koska P-arvo on niin pieni, että nollahypoteesi voidaan hylätä. Tässä tehtävässä P-arvo on ehdollinen todennäköisyys P( Z > 1.77 H 0 on tosi). Jos nollahypoteesi hylätään, P-arvo on todennäköisyys, että tehtiin hylkäysvirhe eli hylättiin H 0 vaikka se oli tosi.
b) Halutaan testata normaalijakauman odotusarvoparametria. H 0 : µ = 70 H 1 : µ 70 Koska varianssia ei tunneta, testisuureena käytetään T-testisuuretta, joka noudattaa nollahypoteesin pätiessä t-jakaumaa vapausasteilla n 1: X T = µ ~ H 0 t( n 1) S/ n Nollahypoteesin pätiessä testisuureen odotusarvo eli normaaliarvo on 0 ja testisuureen itseisarvoltaan suuret arvot viittaavat siihen, että nollahypoteesi ei päde. 68.55 70 t =.66 1.779 / 6 Käytettävä merkitsevyystaso α = 0.05 ja koska vaihtoehtoinen hypoteesi on kaksisuuntainen, hylkäysalue jaetaan t-jakauman hännille. t-jakauman taulukosta luetaan vapausasteilla df = n 1 = 5 kriittiset rajat siten, että jakauman kummallekin hännälle jää todennäköisyys α/ = 0.05 ts. P(T t α/ ) = α/ ja P(T t α/ ) = α/. Kriittiset rajat ovat ±.571. Koska testisuureen laskettu arvo t =.66 <.571, testisuureen havaittu arvo osuu hylkäysalueelle. Nollahypoteesi voidaan hylätä 5 %:n merkitsevyystasolla. Prosessin saanto poikkeaa siis tilastollisesti merkitsevästi tavoitearvosta 70 %. Jos merkitsevyystasoksi otetaan 1 %, kriittisiksi rajoiksi saadaan ± 4.03. Tällöin testin tulos muuttuu: H 0 jää voimaan 1 %:n merkitsevyystasolla. Vertailun vuoksi: testisuureen P-arvo P( T >.66) = 0.045 (laskettu Excelillä). Vaikka b-kohdassa kriittiset rajat ovat itseisarvoltaan suurempia kuin a-kohdassa, b-kohdassa otoksesta estimoitu keskihajonta on pienempi ja tämän takia ero nollahypoteesin mukaisesta arvosta muuttuu tilastollisesti merkitseväksi 5 %:n merkitsevyystasolla. Onko erolla käytännön kannalta merkitystä on kokonaan toinen kysymys, joka ei liity tilastotieteeseen. Vertaa tehtävää myös laskuharjoitusviikon 10 tehtävään 1.
. Testaa 5 %:n merkitsevyystasolla tehtävän 1 b tilanteessa onko keskihajonta merkitsevästi pienempi kuin prosenttiyksikköä. Halutaan testata normaalijakauman varianssia. H 0 : σ = 4 (tai yhtä hyvin nollahypoteesi voidaan kirjoittaa H 0 : σ 4) H 1 : σ < 4 (tässä vaihtoehtoinen hypoteesi on yksisuuntainen) Testisuureena käytetään χ -testisuuretta, joka noudattaa nollahypoteesin pätiessä χ -jakaumaa vapausasteilla n 1: ( n 1) S χ = ~ H χ ( n 1) 0 σ Nollahypoteesin pätiessä testisuureen odotusarvo eli normaaliarvo on n 1 = 5 ja testisuureen pienet arvot viittaavat siihen, että nollahypoteesi ei päde. ( 6 1) 1.779 χ =.4 4 Käytettävä merkitsevyystaso α = 0.05 ja koska vaihtoehtoinen hypoteesi on yksisuuntainen, hylkäysalue on χ -jakauman vasemmalla hännällä. χ -jakauman taulukosta luetaan vapausasteilla df = n 1 = 5 kriittinen raja siten, että jakauman vasemmalle hännälle jää todennäköisyys α = 0.05 ts. P( ) χ χ = α. α Kriittiseksi rajaksi saadaan taulukosta 1.15. Koska testisuureen laskettu arvo χ =.4 > 1.15, testisuureen havaittu arvo ei osu hylkäysalueelle. Nollahypoteesi jää voimaan 5 %:n merkitsevyystasolla. Prosessin saannon keskihajonta ei siis ole tilastollisesti merkitsevästi pienempi kuin prosenttiyksikköä. Vertailun vuoksi: testisuureen P-arvo P(χ.4) = 0.183 (laskettu Excelillä).
3. Eräässä yliopistossa pidetyn tilastotieteen peruskurssin 1. välikokeen tuloksista tehty yhteenveto on esitetty ao. taulukossa. Oletetaan, että havainnot ovat toisistaan riippumattomia ja sekä miesten että naisten tulokset noudattavat normaalijakaumaa. Sukupuoli Lkm Pisteiden keskiarvo Pisteiden keskihajonta Nainen 31 4.4 3.9 Mies 61 3. 3.8 a) Testaa onko naisten pisteiden keskihajonta suurempi kuin miesten käyttäen 5 %:n merkitsevyystasoa. b) Testaa nollahypoteesia, että naisten ja miesten keskimääräiset suoritukset eivät eroa toisistaan 5 %:n merkitsevyystasoa käyttäen. a) Testausasetelma on kahden perusjoukon (tai ryhmän) varianssien vertailutesti. Merkitään alaindeksillä N naisia ja alaindeksillä M miehiä. H 0 : σ H 1 : σ = σ (tai H 0 : σ N M N M σ ) N M > σ (tässä vaihtoehtoinen hypoteesi on yksisuuntainen) Testisuureena käytetään F-testisuuretta, joka noudattaa nollahypoteesin pätiessä F-jakaumaa: ( N M ) SN F = ~ H F n 1, n 1 0 S M Kannattaa valita suurempi otosvarianssi testisuureen osoittajaksi, koska tällöin testisuureen suuret arvot johtavat nollahypoteesin hylkäämiseen ja kriittinen arvo on helpompi lukea taulukosta. Nollahypoteesin pätiessä testisuureen odotusarvo 1. 3.9 F = 1.05. 3.8 5 %:n merkitsevyystasoa vastaava kriittinen arvo on 1.65 vapausastein 30 (osoittaja) ja 60 (nimittäjä). Koska F = 1.05 < 1.65, nollahypoteesi jää voimaan 5 %:n merkitsevyystasolla. Naisten pisteiden hajonta ei siis ole merkitsevästi suurempi kuin miesten. Vertailun vuoksi: testisuureen P-arvo P(F 1.05) = 0.41 (laskettu Excelillä).
b) Testausasetelma on kahden perusjoukon (tai ryhmän) odotusarvojen vertailutesti. Testattavat hypoteesit: H 0 : µ N = µ M H 1 : µ N µ M (tässä vaihtoehtoinen hypoteesi on kaksisuuntainen) Kurssikirjassa ja opetusmonisteessa on tähän tarkoitukseen kaksi eri t-testiä, joista toinen edellyttää varianssien yhtäsuuruutta. Koska havaintojen perusteella ei ole syytä epäillä varianssien yhtäsuuruutta, käytetään seuraavaa t-testiä: XN XM T = 1 1 Sp + nn nm ( ) ( ) nn 1 SN + nm 1 SM Sp = nn + nm df = nn + nm S p on otosten erotuksen harhaton varianssi (p tulee sanasta pooled). Testisuureen itseisarvoltaan suuret arvot johtavat nollahypoteesin hylkäämiseen. ( 31 1) 3.9 + ( 61 1) 3.8 s p = 14.967 31 + 61 4.4 3. t = 1.419 1 1 14.697 + 31 61 df = 31 + 61 = 90 Lainisen taulukosta nähdään, että 5 %:n merkitsevyystasoa vastaavat kriittiset arvot kaksisuuntaiselle vaihtoehtoiselle hypoteesille ovat ±1.980, kun vapausasteita on 10, ja ±.000, kun vapausasteita on 60. Vapausasteilla 90 kriittisen arvon itseisarvo on siis välillä (1.980,.000). Koska testisuureen itseisarvo on pienempi kuin kriittisten arvojen itseisarvo, nollahypoteesi jää voimaan. Naisten ja miesten pisteiden odotusarvot eivät siis eroa merkitsevästi toisistaan. Vertailun vuoksi: testisuureen P-arvo P( T > 1.419) = 0.160 (laskettu Excelillä).
4. Verenpainelääkkeen testauksessa samojen potilaiden (8 kpl) verenpaine mitattiin sekä ennen että jälkeen lääkkeen nauttimisen. Koetulokset (mm/hg) on esitetty ao. taulukossa. Testaa hypoteesia, että lääke ei keskimäärin alenna verenpainetta, kun vaihtoehtoisena hypoteesina on, että lääke keskimäärin alentaa verenpainetta. Käytä 1 %:n merkitsevyystasoa. 1 3 4 5 6 7 8 Jälkeen 18 176 110 149 183 136 118 158 Ennen 134 174 118 15 187 136 15 168 HUOM! Riippumattomien otosten t-testiä ei saa käyttää, koska havainnot riippuvat toisistaan (jokaisen koehenkilön verenpaine on mitattu kahteen kertaan). Tätä kutsutaan usein parivertailutilanteeksi (ks. Laininen s. 61). Testissä menetellään seuraavasti: lasketaan jokaisella koehenkilöllä verenpaineen muutos ja testataan nollahypoteesia, jonka mukaan muutos on keskimäärin nolla. Merkitään: X Ei = havainto ryhmässä E, i = 1,,, n X Ji = havainto ryhmässä J, i = 1,,, n D i = X Ei X Ji, i = 1,,, n (verenpaineen muutos henkilöllä i) Testataan tavallisella yhden otoksen t-testillä nollahypoteesia: H 0 : E(D i ) = 0, i = 1,,, n (tai H 0 : E(D i ) 0) H 1 : E(D i ) > 0, i = 1,,, n (eli lääke alentaa verenpainetta) Otoksesta lasketut tunnusluvut: 8 1 d = di = 4.5 8 i= 1 8 1 sd = ( di d) 16.571 8 1 i= 1 Käytetään seuraavaa t-testiä: D T = ~ H 0 t( n 1) S / n D Huomaa, että testisuureen lausekkeessa n on edellä laskettujen erotusten lukumäärä eli 8. Nollahypoteesin pätiessä testisuure noudattaa t-jakaumaa vapausasteilla n 1 eli 7. Testisuureen arvoksi tulee t = 3.16 ja 1 %:n merkitsevyystasoa vastaava kriittinen arvo on.998. Koska t = 3.16 >.998, nollahypoteesi voidaan hylätä 1 %:n merkitsevyystasolla. Johtopäätöksenä lääke keskimäärin alentaa verenpainetta. Vertailun vuoksi: testisuureen P-arvo P(T > 3.16) = 0.0084 (laskettu Excelillä).
5. Arpajaisten mainoksessa luvataan, että joka viides arpa on voittoarpa. Epäluuloinen Mr B. arvelee, että voittoarpoja on vähemmän, ja päättää tutkia asiaa. Mr B. on tilastomatemaatikko ja päättää käyttää seuraavaa menettelyä: Hän ostaa arpoja, kunnes joko saa voittoarvan tai sitten niin monta tyhjää arpaa, että voi 5 %:n erehtymisriskillä (eli merkitsevyystasolla tai riskitasolla) päätellä, että voittoarpoja on vähemmän kuin 0 % kaikista arvoista. a) Esitä Mr B:n nolla- ja vastahypoteesi. b) Kuinka monen tyhjän arvan jälkeen Mr B. lopettaa arpojen ostamisen? Tehtävän tarkoitus on valaista etukäteen päätetyn merkitsevyystason tai riskitason olemusta. Merkitään p = "voittoarpojen osuus". a) H 0 : p = 0. (tai H 0 : p 0.) H 1 : p < 0. Eli Mr B. olettaa, että arpajaisten mainos pitää paikkansa, ellei hän saa tilastollisesti todistettua, että näin ei ole. b) Koska Mr B. on päättänyt, että erehtymisriski saa olla 5 %, on löydettävä pienin kokonaisluku s.e. P("k tyhjää arpaa peräkkäin" "H 0 on tosi") 0.05. k 0.8 0.05 ln( 0.05) k ln( 0.8) Saadaan k = 14. Eli jos Mr B. ostaa 14 tyhjää arpaa peräkkäin, hän päättelee, että nollahypoteesi ei päde ja voittoarpojen suhteellinen osuus on pienempi kuin 0.. Tällöin hänen johtopäätöksensä on väärä korkeintaan todennäköisyydellä 0.05.
Pistetehtävä 1. Erään tuotteen valmistaja väittää, että tuotteista korkeintaan 5 % on viallisia. Asiakas poimii yksinkertaisen satunnaisotoksen, jonka koko on 0, ja löytää 0 viallista tuotetta. Onko valmistajan väite oikeutettu? Muotoile sopivat hypoteesit ja testaa 1 %:n merkitsevyystasolla. H 0 : p = 0.05 (tai H 0 : p 0.05) H 1 : p > 0.05 Käytetään asymptoottista z-testiä suhteelliselle osuudelle: x/ n p 0/ 0 0.05 z = =.784 p( 1 p) / n 0.05 0.95/ 0 Testin P-arvo on P(Z >.78) = 0.007, joten nollahypoteesi voidaan hylätä 1 %:n merkitsevyystasolla. Johtopäätöksenä valmistajan väite ei vaikuta uskottavalta. Toinen tapa: kriittinen arvo on taulukosta luettuna.36, joten testisuureen laskettu arvo on hylkäysalueella ja nollahypoteesi voidaan hylätä 1 %:n merkitsevyystasolla.
Pistetehtävä. Kone tuottaa osia, joiden halkaisijan voi katsoa noudattavan normaalijakaumaa. Epäillään, että iltapäivällä valmistettujen osien keskimääräinen halkaisija poikkeaa aamupäivällä valmistettujen osien keskimääräisestä halkaisijasta. Sekä aamupäivällä että iltapäivällä valmistetuista osista poimitaan yksinkertaiset satunnaisotokset, osien halkaisijat mitataan ja mittaustulokset ovat taulukossa alla: aamu: 97 9 97 94 96 97 ilta: 93 91 9 93 95 94 (Otostunnusluvut: x A = 95.5, s A = 4.3, x I = 93, s I =, alaindeksit A = aamu, I = ilta) Voidaanko havaintojen perusteella väittää, että aamupäivällä ja iltapäivällä valmistettujen osien keskimääräiset halkaisijat eroavat toisistaan? Muodosta sopivat hypoteesit ja testaa merkitsevyystasolla 0.05. H 0 : µ A = µ I H 1 : µ A µ I Kurssikirjassa ja opetusmonisteessa on kahden otoksen odotusarvojen testaamiseen kaksi eri t-testiä, joista toinen edellyttää varianssien yhtäsuuruutta. Varianssit voidaan olettaa yhtä suuriksi (tätä voi testata F-testillä kuten tehtävässä 3 a). ( 6 1) 4.3+ ( 6 1).0 s p = = 3.15 6+ 6 95.5 93 t =.439 1 1 3.15 + 6 6 df = 6+ 6 = 10 t-jakauman taulukosta luetaan kriittiset arvot ±.8. Koska t =.439 >.8, nollahypoteesi voidaan hylätä 5 %:n merkitsevyystasolla. Aamulla ja illalla valmistettujen osien halkaisijat eroavat toisistaan tilastollisesti merkitsevästi. Vertailun vuoksi: testisuureen P-arvo P( T >.439) = 0.035 (laskettu Excelillä).
Kurssin kotisivulla http://www.sal.tkk.fi/opinnot/mat-.090/ olevaan kyselyyn vastaamalla saa 4 laskuharjoituspistettä. Takaraja kyselyyn vastaamiselle on perjantai 8.11. Tilastollisen testauksen tehtäviin täytyy kirjoittaa (niin laskareissa kuin välikokeissa ja tenteissäkin): - Hypoteesit H 0 ja H 1 - Käytettävä testisuure ja testisuureen laskettu arvo (sekä vapausasteet) - P-arvo tai kriittinen arvo, johon testistä tehtävä johtopäätös perustuu - Vastaus tehtävän kysymykseen.