Mat Sovellettu todennäköisyyslasku A

Samankaltaiset tiedostot
10. laskuharjoituskierros, vko 14, ratkaisut

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

Väliestimointi (jatkoa) Heliövaara 1

Harjoitus 7: NCSS - Tilastollinen analyysi

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

ABHELSINKI UNIVERSITY OF TECHNOLOGY

Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit

Sovellettu todennäköisyyslaskenta B

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2005) 1

¼ ¼ joten tulokset ovat muuttuneet ja nimenomaan huontontuneet eivätkä tulleet paremmiksi.

Testejä suhdeasteikollisille muuttujille

Mat Tilastollisen analyysin perusteet, kevät 2007

Sovellettu todennäköisyyslaskenta B

Testit laatueroasteikollisille muuttujille

Tutkimusongelmia ja tilastollisia hypoteeseja: Perunalastupussien keskimääräinen paino? Nollahypoteesi Vaihtoehtoinen hypoteesi (yksisuuntainen)

Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi. Viikko 5

Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus KE (2014) 1

r = n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit.

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin

Sovellettu todennäköisyyslaskenta B

Odotusarvoparien vertailu. Vilkkumaa / Kuusinen 1

Tilastolliset testit. Tilastolliset testit. Tilastolliset testit: Mitä opimme? 2/5. Tilastolliset testit: Mitä opimme? 1/5

Johdatus varianssianalyysiin. Vilkkumaa / Kuusinen 1

Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1

Sovellettu todennäköisyyslaskenta B

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1

Jos nollahypoteesi pitää paikkansa on F-testisuuren jakautunut Fisherin F-jakauman mukaan

Johdatus tilastotieteeseen Tilastolliset testit. TKK (c) Ilkka Mellin (2005) 1

Valitaan testisuure, jonka jakauma tunnetaan H 0 :n ollessa tosi.

806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy (1 α) = 99 1 α = 0.

Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

1. Nollahypoteesi on, että teksti on kirjoitettu lyhyemmällä murteella. Mahdollisiavaihtoehtojaonvainyksieliettäteksti

dx=5&uilang=fi&lang=fi&lvv=2014

Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen., jos otoskeskiarvo on suurempi kuin 13,96. Mikä on testissä käytetty α:n arvo?

Sovellettu todennäköisyyslaskenta B

χ = Mat Sovellettu todennäköisyyslasku 11. harjoitukset/ratkaisut

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Mat Tilastollisen analyysin perusteet, kevät 2007

Jos nyt on saatu havaintoarvot Ü ½ Ü Ò niin suurimman uskottavuuden

Tilastollisen analyysin perusteet Luento 4: Testi suhteelliselle osuudelle

Testit järjestysasteikollisille muuttujille

031021P Tilastomatematiikka (5 op) viikko 5

MTTTP5, luento Otossuureita ja niiden jakaumia (jatkuu)

Mat Tilastollisen analyysin perusteet, kevät 2007

Tavanomaisten otostunnuslukujen, odotusarvon luottamusvälin ja Box ja Whisker -kuvion määritelmät: ks. 1. harjoitukset.

Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit

Sovellettu todennäköisyyslaskenta B

Tilastollinen aineisto Luottamusväli

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu

riippumattomia ja noudattavat samaa jakaumaa.

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu

/1. MTTTP5, luento Normaalijakauma (jatkuu) Binomijakaumaa voidaan approksimoida normaalijakaumalla

/1. MTTTP1, luento Normaalijakauma (jatkoa) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti:

/1. MTTTP5, luento Normaalijakauma (jatkuu) Binomijakaumaa voidaan approksimoida normaalijakaumalla

Sovellettu todennäköisyyslaskenta B

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Mat Tilastollisen analyysin perusteet, kevät 2007

HAVAITUT JA ODOTETUT FREKVENSSIT

/1. MTTTP1, luento Normaalijakauma (kertausta) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti:

Tilastollisia peruskäsitteitä ja Monte Carlo

Tilastollisen analyysin perusteet Luento 5: Jakaumaoletuksien. testaaminen

edellyttää valintaa takaisinpanolla Aritmeettinen keskiarvo Jos, ½ Ò muodostavat satunnaisotoksen :n jakaumasta niin Otosvarianssi Ë ¾

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

11. laskuharjoituskierros, vko 15, ratkaisut

Otoskeskiarvo on otossuure, jonka todennäköisyysjakauma tiedetään. Se on normaalijakauma, havainnollistaminen simuloiden

2. TILASTOLLINEN TESTAAMINEN...

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

9. laskuharjoituskierros, vko 12-13, ratkaisut

tilastotieteen kertaus

Luentokalvoja tilastollisesta päättelystä. Kalvot laatinut Aki Taanila Päivitetty

Kaksisuuntainen varianssianalyysi. Vilkkumaa / Kuusinen 1

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Sovellettu todennäköisyyslaskenta B

Estimointi. Vilkkumaa / Kuusinen 1

Mat Sovellettu todennäköisyyslasku A

Tilastollisen analyysin perusteet Luento 6: Korrelaatio ja riippuvuus tilastotieteessä

Tilastotieteen kertaus. Kuusinen/Heliövaara 1

Sisällysluettelo ESIPUHE KIRJAN 1. PAINOKSEEN...3 ESIPUHE KIRJAN 2. PAINOKSEEN...3 SISÄLLYSLUETTELO...4

Aalto-yliopisto, Matematiikan ja systeemianalyysin laitos /Malmivuori MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi,

Hypoteesin testaus Alkeet

Tilastollisen analyysin perusteet Luento 11: Epäparametrinen vastine ANOVAlle

Gripenberg. MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Tentti ja välikoeuusinta

Mat Tilastollisen analyysin perusteet, kevät 2007

/1. MTTTP5, luento Kertausta. Olk. X 1, X 2,..., X n on satunnaisotos N(µ, ):sta, missä tunnettu. Jos H 0 on tosi, niin

MTTTP5, luento Kahden jakauman sijainnin vertailu (jatkoa) Tutkimustilanteita y = neliöhinta x = sijainti (2 aluetta)

Sisällysluettelo ESIPUHE... 4 ALKUSANAT E-KIRJA VERSIOON... 5 SISÄLLYSLUETTELO JOHDANTO TILASTOLLISEEN PÄÄTTELYYN TODENNÄKÖISYYS...

Otoskoko 107 kpl. a) 27 b) 2654

Estimointi populaation tuntemattoman parametrin arviointia otossuureen avulla Otossuure satunnaisotoksen avulla määritelty funktio

Estimointi. Otantajakauma

6.1.2 Yhdessä populaatiossa tietyn tyyppisten alkioiden prosentuaalista osuutta koskeva päättely

Kaavakokoelma, testikaaviot ja jakaumataulukot liitteinä. Ei omia taulukoita! Laskin sallittu.

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Transkriptio:

TKK / Systeemianalyysin laboratorio Mat-.090 Sovellettu todennäköisyyslasku A Harjoitus 11 (vko 48/003) (Aihe: Tilastollisia testejä, Laininen luvut 4.9, 15.1-15.4, 15.7) Nordlund 1. Kemiallisen prosessin saanto X on normaalijakautunut. Tehdas pyrkii pitämään prosessin saannon tasolla 70 %. Poimitaan yksinkertainen satunnaisotos saannosta ja saadaan havaintoarvot (yksikkönä %): 68. 67.5 70. 66.7 69.0 69.7 Poikkeaako saanto tavoitearvosta 70 %? Testaa 5 %:n merkitsevyystasolla, kun a) tiedetään, että X:n keskihajonta on prosenttiyksikköä. b) X:n keskihajontaa ei tunneta. (otoskeskiarvo x = 68.55 ja otosvarianssi s = 1.779 ). Muuttuvatko tulokset, jos merkitsevyystasoksi valitaankin 1 %? Merkitsevyystasosta (engl. significance level) käytetään myös termiä riskitaso. a) Halutaan testata normaalijakauman odotusarvoparametria. Nollahypoteesi: H 0 : µ = 70 (eli saannon odotusarvo on 70 %) Vaihtoehtoinen hypoteesi (tai vastahypoteesi): H 1 : µ 70 (eli saannon odotusarvo poikkeaa tavoitearvosta 70 %) Jos nollahypoteesi hylätään, vaihtoehtoinen hypoteesi hyväksytään. Tässä testissä käytetään nk. kaksisuuntaista vaihtoehtoista hypoteesia. Testisuureena käytetään ns. Z-testisuuretta, joka noudattaa nollahypoteesin pätiessä standardoitua normaalijakaumaa N(0, 1): X µ Z = ~ H 0 N(0,1) σ / n Nollahypoteesin pätiessä testisuureen odotusarvo eli normaaliarvo on 0 ja testisuureen itseisarvoltaan suuret arvot viittaavat siihen, että nollahypoteesi ei päde. 68.55 70 z = 1.77 / 6 Testisuureen P-arvo saadaan normaalijakauman taulukosta: ( Z ) ( Z ) ( Z ) ( Z ) P 1.77 = P 1.77 + P 1.77 = P 1.77 = 0.0384 = 0.0768 P-arvon sanallinen tulkinta: todennäköisyys saada nollahypoteesin pätiessä otos, joka poikkeaa itseisarvoltaan vähintään havaitun verran nollahypoteesin mukaisesta arvosta.

Koska P-arvo on suurempi kuin valittu merkitsevyystaso 5 %, nollahypoteesi jää voimaan. Tämä tarkoittaa, että havainnot eivät poikkea tilastollisesti merkitsevästi nollahypoteesin mukaisesta arvosta, ja tämän perusteella on mahdollista, että prosessin saannon odotusarvo on 70 %. Jos merkitsevyystasoksi valitaan 1 %, testin tulos ei muutu eli nollahypoteesi jää edelleen voimaan (P-arvo on suurempi kuin merkitsevyystaso). Toinen tapa Koska useimmille testeille ei ole mahdollista lukea P-arvoa taulukoista (ainakaan käyttökelpoisella tarkuudella), testistä tehtävät johtopäätökset joudutaan perustamaan nk. kriittisiin rajoihin (myös termejä kriittinen arvo ja hylkäysraja käytetään). Tällöin testi tehdään seuraavalla tavalla: H 0 : µ = 70 H 1 : µ 70 68.55 70 z = 1.77 / 6 Käytettävä merkitsevyystaso α = 0.05 ja koska vaihtoehtoinen hypoteesi on kaksisuuntainen, hylkäysalue jaetaan N(0, 1) jakauman hännille. Normaalijakauman taulukosta luetaan kriittiset rajat siten, että jakauman kummallekin hännälle jää todennäköisyys α/ = 0.05 ts. P(Z z α/ ) = α/ ja P(Z z α/ ) = α/. Kriittiset rajat ovat ± 1.96. Koska testisuureen laskettu arvo on kriittisten rajojen välissä, nollahypoteesi jää voimaan 5 %:n merkitsevyystasolla. Prosessin saanto ei siis poikkea tilastollisesti merkitsevästi tavoitearvosta 70 %. On siis mahdollista, että havaintojen poikkeama tavoitearvosta johtuu satunnaisvaihtelusta. Jos merkitsevyystasoksi otetaan 1 %, kriittiset rajat muuttuvat. Tällöin kriittisiksi rajoiksi saadaan taulukosta ±.576. Testin tulos ei muutu. P-arvojen käyttäminen on "oikea" tapa tehdä tilastollisia testejä. P-arvo sisältää enemmän informaatiota kuin kriittiset rajat ja testisuureen laskettu arvo. Koska kurssilla joudutaan tukeutumaan taulukoihin, joudutaan useimmissa tapauksissa tyytymään lasketun testisuureen ja merkitsevyystason sekä vaihtoehtoisen hypoteesin määräämien kriittisten rajojen vertailuun. Kaikki tilastollisia testejä tekevät tietokoneohjelmat tulostavat testeille P-arvon ja on tutkijan päätettävissä, koska P-arvo on niin pieni, että nollahypoteesi voidaan hylätä. Tässä tehtävässä P-arvo on ehdollinen todennäköisyys P( Z > 1.77 H 0 on tosi). Jos nollahypoteesi hylätään, P-arvo on todennäköisyys, että tehtiin hylkäysvirhe eli hylättiin H 0 vaikka se oli tosi.

b) Halutaan testata normaalijakauman odotusarvoparametria. H 0 : µ = 70 H 1 : µ 70 Koska varianssia ei tunneta, testisuureena käytetään T-testisuuretta, joka noudattaa nollahypoteesin pätiessä t-jakaumaa vapausasteilla n 1: X T = µ ~ H 0 t( n 1) S/ n Nollahypoteesin pätiessä testisuureen odotusarvo eli normaaliarvo on 0 ja testisuureen itseisarvoltaan suuret arvot viittaavat siihen, että nollahypoteesi ei päde. 68.55 70 t =.66 1.779 / 6 Käytettävä merkitsevyystaso α = 0.05 ja koska vaihtoehtoinen hypoteesi on kaksisuuntainen, hylkäysalue jaetaan t-jakauman hännille. t-jakauman taulukosta luetaan vapausasteilla df = n 1 = 5 kriittiset rajat siten, että jakauman kummallekin hännälle jää todennäköisyys α/ = 0.05 ts. P(T t α/ ) = α/ ja P(T t α/ ) = α/. Kriittiset rajat ovat ±.571. Koska testisuureen laskettu arvo t =.66 <.571, testisuureen havaittu arvo osuu hylkäysalueelle. Nollahypoteesi voidaan hylätä 5 %:n merkitsevyystasolla. Prosessin saanto poikkeaa siis tilastollisesti merkitsevästi tavoitearvosta 70 %. Jos merkitsevyystasoksi otetaan 1 %, kriittisiksi rajoiksi saadaan ± 4.03. Tällöin testin tulos muuttuu: H 0 jää voimaan 1 %:n merkitsevyystasolla. Vertailun vuoksi: testisuureen P-arvo P( T >.66) = 0.045 (laskettu Excelillä). Vaikka b-kohdassa kriittiset rajat ovat itseisarvoltaan suurempia kuin a-kohdassa, b-kohdassa otoksesta estimoitu keskihajonta on pienempi ja tämän takia ero nollahypoteesin mukaisesta arvosta muuttuu tilastollisesti merkitseväksi 5 %:n merkitsevyystasolla. Onko erolla käytännön kannalta merkitystä on kokonaan toinen kysymys, joka ei liity tilastotieteeseen. Vertaa tehtävää myös laskuharjoitusviikon 10 tehtävään 1.

. Testaa 5 %:n merkitsevyystasolla tehtävän 1 b tilanteessa onko keskihajonta merkitsevästi pienempi kuin prosenttiyksikköä. Halutaan testata normaalijakauman varianssia. H 0 : σ = 4 (tai yhtä hyvin nollahypoteesi voidaan kirjoittaa H 0 : σ 4) H 1 : σ < 4 (tässä vaihtoehtoinen hypoteesi on yksisuuntainen) Testisuureena käytetään χ -testisuuretta, joka noudattaa nollahypoteesin pätiessä χ -jakaumaa vapausasteilla n 1: ( n 1) S χ = ~ H χ ( n 1) 0 σ Nollahypoteesin pätiessä testisuureen odotusarvo eli normaaliarvo on n 1 = 5 ja testisuureen pienet arvot viittaavat siihen, että nollahypoteesi ei päde. ( 6 1) 1.779 χ =.4 4 Käytettävä merkitsevyystaso α = 0.05 ja koska vaihtoehtoinen hypoteesi on yksisuuntainen, hylkäysalue on χ -jakauman vasemmalla hännällä. χ -jakauman taulukosta luetaan vapausasteilla df = n 1 = 5 kriittinen raja siten, että jakauman vasemmalle hännälle jää todennäköisyys α = 0.05 ts. P( ) χ χ = α. α Kriittiseksi rajaksi saadaan taulukosta 1.15. Koska testisuureen laskettu arvo χ =.4 > 1.15, testisuureen havaittu arvo ei osu hylkäysalueelle. Nollahypoteesi jää voimaan 5 %:n merkitsevyystasolla. Prosessin saannon keskihajonta ei siis ole tilastollisesti merkitsevästi pienempi kuin prosenttiyksikköä. Vertailun vuoksi: testisuureen P-arvo P(χ.4) = 0.183 (laskettu Excelillä).

3. Eräässä yliopistossa pidetyn tilastotieteen peruskurssin 1. välikokeen tuloksista tehty yhteenveto on esitetty ao. taulukossa. Oletetaan, että havainnot ovat toisistaan riippumattomia ja sekä miesten että naisten tulokset noudattavat normaalijakaumaa. Sukupuoli Lkm Pisteiden keskiarvo Pisteiden keskihajonta Nainen 31 4.4 3.9 Mies 61 3. 3.8 a) Testaa onko naisten pisteiden keskihajonta suurempi kuin miesten käyttäen 5 %:n merkitsevyystasoa. b) Testaa nollahypoteesia, että naisten ja miesten keskimääräiset suoritukset eivät eroa toisistaan 5 %:n merkitsevyystasoa käyttäen. a) Testausasetelma on kahden perusjoukon (tai ryhmän) varianssien vertailutesti. Merkitään alaindeksillä N naisia ja alaindeksillä M miehiä. H 0 : σ H 1 : σ = σ (tai H 0 : σ N M N M σ ) N M > σ (tässä vaihtoehtoinen hypoteesi on yksisuuntainen) Testisuureena käytetään F-testisuuretta, joka noudattaa nollahypoteesin pätiessä F-jakaumaa: ( N M ) SN F = ~ H F n 1, n 1 0 S M Kannattaa valita suurempi otosvarianssi testisuureen osoittajaksi, koska tällöin testisuureen suuret arvot johtavat nollahypoteesin hylkäämiseen ja kriittinen arvo on helpompi lukea taulukosta. Nollahypoteesin pätiessä testisuureen odotusarvo 1. 3.9 F = 1.05. 3.8 5 %:n merkitsevyystasoa vastaava kriittinen arvo on 1.65 vapausastein 30 (osoittaja) ja 60 (nimittäjä). Koska F = 1.05 < 1.65, nollahypoteesi jää voimaan 5 %:n merkitsevyystasolla. Naisten pisteiden hajonta ei siis ole merkitsevästi suurempi kuin miesten. Vertailun vuoksi: testisuureen P-arvo P(F 1.05) = 0.41 (laskettu Excelillä).

b) Testausasetelma on kahden perusjoukon (tai ryhmän) odotusarvojen vertailutesti. Testattavat hypoteesit: H 0 : µ N = µ M H 1 : µ N µ M (tässä vaihtoehtoinen hypoteesi on kaksisuuntainen) Kurssikirjassa ja opetusmonisteessa on tähän tarkoitukseen kaksi eri t-testiä, joista toinen edellyttää varianssien yhtäsuuruutta. Koska havaintojen perusteella ei ole syytä epäillä varianssien yhtäsuuruutta, käytetään seuraavaa t-testiä: XN XM T = 1 1 Sp + nn nm ( ) ( ) nn 1 SN + nm 1 SM Sp = nn + nm df = nn + nm S p on otosten erotuksen harhaton varianssi (p tulee sanasta pooled). Testisuureen itseisarvoltaan suuret arvot johtavat nollahypoteesin hylkäämiseen. ( 31 1) 3.9 + ( 61 1) 3.8 s p = 14.967 31 + 61 4.4 3. t = 1.419 1 1 14.697 + 31 61 df = 31 + 61 = 90 Lainisen taulukosta nähdään, että 5 %:n merkitsevyystasoa vastaavat kriittiset arvot kaksisuuntaiselle vaihtoehtoiselle hypoteesille ovat ±1.980, kun vapausasteita on 10, ja ±.000, kun vapausasteita on 60. Vapausasteilla 90 kriittisen arvon itseisarvo on siis välillä (1.980,.000). Koska testisuureen itseisarvo on pienempi kuin kriittisten arvojen itseisarvo, nollahypoteesi jää voimaan. Naisten ja miesten pisteiden odotusarvot eivät siis eroa merkitsevästi toisistaan. Vertailun vuoksi: testisuureen P-arvo P( T > 1.419) = 0.160 (laskettu Excelillä).

4. Verenpainelääkkeen testauksessa samojen potilaiden (8 kpl) verenpaine mitattiin sekä ennen että jälkeen lääkkeen nauttimisen. Koetulokset (mm/hg) on esitetty ao. taulukossa. Testaa hypoteesia, että lääke ei keskimäärin alenna verenpainetta, kun vaihtoehtoisena hypoteesina on, että lääke keskimäärin alentaa verenpainetta. Käytä 1 %:n merkitsevyystasoa. 1 3 4 5 6 7 8 Jälkeen 18 176 110 149 183 136 118 158 Ennen 134 174 118 15 187 136 15 168 HUOM! Riippumattomien otosten t-testiä ei saa käyttää, koska havainnot riippuvat toisistaan (jokaisen koehenkilön verenpaine on mitattu kahteen kertaan). Tätä kutsutaan usein parivertailutilanteeksi (ks. Laininen s. 61). Testissä menetellään seuraavasti: lasketaan jokaisella koehenkilöllä verenpaineen muutos ja testataan nollahypoteesia, jonka mukaan muutos on keskimäärin nolla. Merkitään: X Ei = havainto ryhmässä E, i = 1,,, n X Ji = havainto ryhmässä J, i = 1,,, n D i = X Ei X Ji, i = 1,,, n (verenpaineen muutos henkilöllä i) Testataan tavallisella yhden otoksen t-testillä nollahypoteesia: H 0 : E(D i ) = 0, i = 1,,, n (tai H 0 : E(D i ) 0) H 1 : E(D i ) > 0, i = 1,,, n (eli lääke alentaa verenpainetta) Otoksesta lasketut tunnusluvut: 8 1 d = di = 4.5 8 i= 1 8 1 sd = ( di d) 16.571 8 1 i= 1 Käytetään seuraavaa t-testiä: D T = ~ H 0 t( n 1) S / n D Huomaa, että testisuureen lausekkeessa n on edellä laskettujen erotusten lukumäärä eli 8. Nollahypoteesin pätiessä testisuure noudattaa t-jakaumaa vapausasteilla n 1 eli 7. Testisuureen arvoksi tulee t = 3.16 ja 1 %:n merkitsevyystasoa vastaava kriittinen arvo on.998. Koska t = 3.16 >.998, nollahypoteesi voidaan hylätä 1 %:n merkitsevyystasolla. Johtopäätöksenä lääke keskimäärin alentaa verenpainetta. Vertailun vuoksi: testisuureen P-arvo P(T > 3.16) = 0.0084 (laskettu Excelillä).

5. Arpajaisten mainoksessa luvataan, että joka viides arpa on voittoarpa. Epäluuloinen Mr B. arvelee, että voittoarpoja on vähemmän, ja päättää tutkia asiaa. Mr B. on tilastomatemaatikko ja päättää käyttää seuraavaa menettelyä: Hän ostaa arpoja, kunnes joko saa voittoarvan tai sitten niin monta tyhjää arpaa, että voi 5 %:n erehtymisriskillä (eli merkitsevyystasolla tai riskitasolla) päätellä, että voittoarpoja on vähemmän kuin 0 % kaikista arvoista. a) Esitä Mr B:n nolla- ja vastahypoteesi. b) Kuinka monen tyhjän arvan jälkeen Mr B. lopettaa arpojen ostamisen? Tehtävän tarkoitus on valaista etukäteen päätetyn merkitsevyystason tai riskitason olemusta. Merkitään p = "voittoarpojen osuus". a) H 0 : p = 0. (tai H 0 : p 0.) H 1 : p < 0. Eli Mr B. olettaa, että arpajaisten mainos pitää paikkansa, ellei hän saa tilastollisesti todistettua, että näin ei ole. b) Koska Mr B. on päättänyt, että erehtymisriski saa olla 5 %, on löydettävä pienin kokonaisluku s.e. P("k tyhjää arpaa peräkkäin" "H 0 on tosi") 0.05. k 0.8 0.05 ln( 0.05) k ln( 0.8) Saadaan k = 14. Eli jos Mr B. ostaa 14 tyhjää arpaa peräkkäin, hän päättelee, että nollahypoteesi ei päde ja voittoarpojen suhteellinen osuus on pienempi kuin 0.. Tällöin hänen johtopäätöksensä on väärä korkeintaan todennäköisyydellä 0.05.

Pistetehtävä 1. Erään tuotteen valmistaja väittää, että tuotteista korkeintaan 5 % on viallisia. Asiakas poimii yksinkertaisen satunnaisotoksen, jonka koko on 0, ja löytää 0 viallista tuotetta. Onko valmistajan väite oikeutettu? Muotoile sopivat hypoteesit ja testaa 1 %:n merkitsevyystasolla. H 0 : p = 0.05 (tai H 0 : p 0.05) H 1 : p > 0.05 Käytetään asymptoottista z-testiä suhteelliselle osuudelle: x/ n p 0/ 0 0.05 z = =.784 p( 1 p) / n 0.05 0.95/ 0 Testin P-arvo on P(Z >.78) = 0.007, joten nollahypoteesi voidaan hylätä 1 %:n merkitsevyystasolla. Johtopäätöksenä valmistajan väite ei vaikuta uskottavalta. Toinen tapa: kriittinen arvo on taulukosta luettuna.36, joten testisuureen laskettu arvo on hylkäysalueella ja nollahypoteesi voidaan hylätä 1 %:n merkitsevyystasolla.

Pistetehtävä. Kone tuottaa osia, joiden halkaisijan voi katsoa noudattavan normaalijakaumaa. Epäillään, että iltapäivällä valmistettujen osien keskimääräinen halkaisija poikkeaa aamupäivällä valmistettujen osien keskimääräisestä halkaisijasta. Sekä aamupäivällä että iltapäivällä valmistetuista osista poimitaan yksinkertaiset satunnaisotokset, osien halkaisijat mitataan ja mittaustulokset ovat taulukossa alla: aamu: 97 9 97 94 96 97 ilta: 93 91 9 93 95 94 (Otostunnusluvut: x A = 95.5, s A = 4.3, x I = 93, s I =, alaindeksit A = aamu, I = ilta) Voidaanko havaintojen perusteella väittää, että aamupäivällä ja iltapäivällä valmistettujen osien keskimääräiset halkaisijat eroavat toisistaan? Muodosta sopivat hypoteesit ja testaa merkitsevyystasolla 0.05. H 0 : µ A = µ I H 1 : µ A µ I Kurssikirjassa ja opetusmonisteessa on kahden otoksen odotusarvojen testaamiseen kaksi eri t-testiä, joista toinen edellyttää varianssien yhtäsuuruutta. Varianssit voidaan olettaa yhtä suuriksi (tätä voi testata F-testillä kuten tehtävässä 3 a). ( 6 1) 4.3+ ( 6 1).0 s p = = 3.15 6+ 6 95.5 93 t =.439 1 1 3.15 + 6 6 df = 6+ 6 = 10 t-jakauman taulukosta luetaan kriittiset arvot ±.8. Koska t =.439 >.8, nollahypoteesi voidaan hylätä 5 %:n merkitsevyystasolla. Aamulla ja illalla valmistettujen osien halkaisijat eroavat toisistaan tilastollisesti merkitsevästi. Vertailun vuoksi: testisuureen P-arvo P( T >.439) = 0.035 (laskettu Excelillä).

Kurssin kotisivulla http://www.sal.tkk.fi/opinnot/mat-.090/ olevaan kyselyyn vastaamalla saa 4 laskuharjoituspistettä. Takaraja kyselyyn vastaamiselle on perjantai 8.11. Tilastollisen testauksen tehtäviin täytyy kirjoittaa (niin laskareissa kuin välikokeissa ja tenteissäkin): - Hypoteesit H 0 ja H 1 - Käytettävä testisuure ja testisuureen laskettu arvo (sekä vapausasteet) - P-arvo tai kriittinen arvo, johon testistä tehtävä johtopäätös perustuu - Vastaus tehtävän kysymykseen.