031021P Tilastomatematiikka (5 op) viikko 5

Samankaltaiset tiedostot
Sovellettu todennäköisyyslaskenta B

Väliestimointi (jatkoa) Heliövaara 1

ABHELSINKI UNIVERSITY OF TECHNOLOGY

Harjoitus 7: NCSS - Tilastollinen analyysi

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

Sovellettu todennäköisyyslaskenta B

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Tilastollinen aineisto Luottamusväli

Tutkimusongelmia ja tilastollisia hypoteeseja: Perunalastupussien keskimääräinen paino? Nollahypoteesi Vaihtoehtoinen hypoteesi (yksisuuntainen)

Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2005) 1

Mat Tilastollisen analyysin perusteet, kevät 2007

Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1

Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1

Sovellettu todennäköisyyslaskenta B

Testit laatueroasteikollisille muuttujille

Odotusarvoparien vertailu. Vilkkumaa / Kuusinen 1

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu

Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus KE (2014) 1

Estimointi. Vilkkumaa / Kuusinen 1

Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen., jos otoskeskiarvo on suurempi kuin 13,96. Mikä on testissä käytetty α:n arvo?

Valitaan testisuure, jonka jakauma tunnetaan H 0 :n ollessa tosi.

Testejä suhdeasteikollisille muuttujille

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

Mat Sovellettu todennäköisyyslasku A

Hypoteesin testaus Alkeet

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B

Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

10. laskuharjoituskierros, vko 14, ratkaisut

031021P Tilastomatematiikka (5 op) viikko 4

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

MTTTP5, luento Otossuureita ja niiden jakaumia (jatkuu)

Johdatus tilastotieteeseen Tilastolliset testit. TKK (c) Ilkka Mellin (2005) 1

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi. Viikko 5

Todennäköisyyden ominaisuuksia

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin

Tilastollisia peruskäsitteitä ja Monte Carlo

Tilastotieteen kertaus. Kuusinen/Heliövaara 1

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Satunnaismuuttujien mittausasteikot 93

Tilastolliset testit. Tilastolliset testit. Tilastolliset testit: Mitä opimme? 2/5. Tilastolliset testit: Mitä opimme? 1/5

806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy (1 α) = 99 1 α = 0.

POPULAATIO. Oikeastaan arvot, joista ollaan kiinnostuneita (mitatut numeeriset suureet, luokittelut).

Estimointi populaation tuntemattoman parametrin arviointia otossuureen avulla Otossuure satunnaisotoksen avulla määritelty funktio

tilastotieteen kertaus

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

dx=5&uilang=fi&lang=fi&lvv=2014

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Sovellettu todennäköisyyslaskenta B

9. laskuharjoituskierros, vko 12-13, ratkaisut

Luentokalvoja tilastollisesta päättelystä. Kalvot laatinut Aki Taanila Päivitetty

edellyttää valintaa takaisinpanolla Aritmeettinen keskiarvo Jos, ½ Ò muodostavat satunnaisotoksen :n jakaumasta niin Otosvarianssi Ë ¾

Kynä-paperi -harjoitukset. Taina Lehtinen Taina I Lehtinen Helsingin yliopisto

Osa 2: Otokset, otosjakaumat ja estimointi

Teema 8: Parametrien estimointi ja luottamusvälit

Johdatus varianssianalyysiin. Vilkkumaa / Kuusinen 1

Sovellettu todennäköisyyslaskenta B

2. Keskiarvojen vartailua

1. Tilastollinen malli??

Estimointi. Otantajakauma

031021P Tilastomatematiikka (5 op) viikko 3

031021P Tilastomatematiikka (5 op) kertausta 2. vk:een

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Luottamusvälit. Normaalijakauma johnkin kohtaan

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1

1. Nollahypoteesi on, että teksti on kirjoitettu lyhyemmällä murteella. Mahdollisiavaihtoehtojaonvainyksieliettäteksti

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

r = n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit.

riippumattomia ja noudattavat samaa jakaumaa.

Kaksisuuntainen varianssianalyysi. Vilkkumaa / Kuusinen 1

χ = Mat Sovellettu todennäköisyyslasku 11. harjoitukset/ratkaisut

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

Sovellettu todennäköisyyslaskenta B

/1. MTTTP1, luento Normaalijakauma (jatkoa) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti:

Testit järjestysasteikollisille muuttujille

Jos nollahypoteesi pitää paikkansa on F-testisuuren jakautunut Fisherin F-jakauman mukaan

¼ ¼ joten tulokset ovat muuttuneet ja nimenomaan huontontuneet eivätkä tulleet paremmiksi.

Tilastollisen analyysin perusteet Luento 4: Testi suhteelliselle osuudelle

/1. MTTTP5, luento Normaalijakauma (jatkuu) Binomijakaumaa voidaan approksimoida normaalijakaumalla

Tutkimustiedonhallinnan peruskurssi

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

031021P Tilastomatematiikka (5 op) kertausta 2. vk:een

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?

6. laskuharjoitusten vastaukset (viikot 10 11)

5.7 Uskottavuusfunktioon perustuvia testejä II

Jos nyt on saatu havaintoarvot Ü ½ Ü Ò niin suurimman uskottavuuden

Tilastollinen testaaminen tai Tilastollinen päättely. Geneettinen analyysi

Estimointi. Luottamusvälin laskeminen keskiarvolle α/2 α/2 0.1

Kaksisuuntainen varianssianalyysi. Heliövaara 1

/1. MTTTP5, luento Normaalijakauma (jatkuu) Binomijakaumaa voidaan approksimoida normaalijakaumalla

3.6 Su-estimaattorien asymptotiikka

Otoskoko 107 kpl. a) 27 b) 2654

Transkriptio:

031021P Tilastomatematiikka (5 op) viikko 5 Jukka Kemppainen Mathematics Division

Hypoteesin testauksesta Tilastollisessa testauksessa on kyse havainnoista tapahtuvasta päätöksenteosta. Kokeellisen tutkimuksen keskeisiä työskentelytapoja on asettaa hypoteeseja ja testata niiden sopivuus havainnoista. Koska havaintoihin sisältyy aina koe- ym. virheiden johdosta satunnaisvaihtelua, yleensä ei voida tehdä täysin varmoja päätelmiä. Puhdas sattumakin voi synnyttää näennäisesti merkitsevän tapahtuman, mikä on päätöksenteossa otettava huomioon. Sattuman mahdollisuutta voidaan arvioida todennäköisyyksien avulla, jolloin päättelyyn liittyvä epävarmuus voidaan kvantifioida. Jukka Kemppainen Mathematics Division 2 / 35

Hypoteesin testaus Tilastollinen hypoteesi formuloidaan usein niin, että se voidaan testata tekemällä huolellisesti suunniteltuja kokeita. Tilastollinen hypoteesi voi olla esimerkiksi jakauman parametreihin liittyvä olettamus. Tehdään kaksi hypoteesia, nollahypoteesi H 0 ja sille vaihtoehtoinen vastahypoteesi H 1. Hypoteesin testauksessa lähdetään tutkimaan tukevatko havainnot nollahypoteesin H 0 oikeellisuutta. Jos havainnot tukevat hypoteesia H 0, se hyväksytään tai todetaan, että havaintojen perusteella sitä ei ole syytä hylätä. Jos havainnot eivät tue hypoteesia H 0, hylätään H 0 ja hyväksytään vaihtoehtoinen hypoteesi H 1. Jukka Kemppainen Mathematics Division 3 / 35

Nollahypoteesi ja vaihtoehtoinen hypoteesi (1/2) Huomautus 11 Usein käytetään ilmaisua ei ole syytä/ei voi hylätä H 0 :aa sen sijaan, että sanottaisiin hyväksytään H 0. Huomautuksen perustelu: Hypoteesin H 0 väittämä edustaa tilaa status quo ja H 1 sille vaihtoehtoista väittämää. Koska testaukseen liittyy usein epävarmuutta, niin siitä, ettei meillä ole näyttöä nollahypoteesia vastaan, ei seuraa, että H 0 olisi totta. Edellistä kuvaa ehkä parhaiten esimerkki rikosoikeudenkäynnistä, jossa hypoteesit ovat H 0 : vastaaja on syytön, H 1 : vastaaja on syyllinen. Jukka Kemppainen Mathematics Division 4 / 35

Nollahypoteesi ja vaihtoehtoinen hypoteesi (2/2) Lähtökohtaisesti H 0 on totta (kunnes toisin todistetaan). Jos H 1 :stä tukeva näyttö on kiistaton, niin H 0 hylätään. Meillä voi olla näyttöä syytettyä vastaan, mutta välttämättä näyttö ei riitä tuomitsemiseen. Niinpä tuomari toteaa, että H 0 :aa ei voida hylätä (eli vastaajaa ei voi tuomita) sen sijaan, että H 0 hyväksytään (eli vastaaja on syytön). Jukka Kemppainen Mathematics Division 5 / 35

Esimerkki Tarkastellaan esimerkkinä lapsen syntymää. Testiongelmana voidaan tarkastella esimerkiksi syntyvän lapsen sukupuolta koskeva päätöksenteko. On kaksi mahdollisuutta, joko syntyvä lapsi on poika (P) tai tyttö (T). Intuitiivisesti tuntuu järkevältä, että molemmat tapahtumat ovat yhtä todennäköisiä. Kuitenkin kirjallisuudessa usein väitetään, että pojan syntymistodennäköisyys on jonkin verran suurempi kuin tytön. Halutaan testata, että missä määrin pojan syntymistodennäköisyys on suurempi kuin tytön. Jos merkitään, että pojan syntymistn. on p, valitaan nollahypoteesiksi H 0 : p = p 0 = 50%. Vastahypoteesiksi valitaan H 1 : p > p 0 = 50%. Hypoteesin testaukseen käytetään aineistoa, jonka mukaan 3000:sta lapsesta oli poikia 1578. Jos n = 3000 aineistossa on tyttöjä ja poikia suurin piirtein yhtä paljon, hyväksytään H 0. Jos taas poikia on riittävän paljon enemmän kuin tyttöjä, hylätään H 0 ja hyväksytään H 1. Jukka Kemppainen Mathematics Division 6 / 35

Esimerkki Esim. 35 Erään kaupungin työssäkäyvistä arvioidaan olevan korkeakoulutettuja 60 %. Muotoile sopivat testattavat hypoteesit, kun halutaan testata (a) onko korkeakoulutettuja 60 %. (b) onko korkeakoulutettuja vähintään 60 %. Jukka Kemppainen Mathematics Division 7 / 35

Hypoteesin testauksen terminologiaa Olkoon θ jakauman tuntematon parametri ja testataan hypoteesia H 0 : θ = θ 0. Vastahypoteesille H 1 on kolme mahdollisuutta 1. H 1 : θ > θ 0, 2. H 1 : θ < θ 0, 3. H 1 : θ θ 0. Kohtien 1. ja 2. hypoteeseja sanotaan yksisuuntaisiksi ja kohdan 3. hypoteesia kaksisuuntaiseksi. Hypoteesin testausta varten tarvitaan testimuuttuja Θ, joka on parametrin θ harhaton estimaattori, tai jokin sen muunnos. Yleisesti testisuure on otossuure Z = Z(X 1,...,X n ), jonka perusteella päätös tehdään. Z:n kaikkien mahdollisten arvojen joukko S jaetaan kahteen alueeseen, hyväksymisalueeseen S 0 ja hylkäysalueeseen S 1, missä S 0 S 1 = ja S 0 S 1 = S. Jukka Kemppainen Mathematics Division 8 / 35

Hypoteesin testauksen terminologiaa Testimuuttujan arvo z = z(x 1,...,x n ) lasketaan otoksesta (x 1,...,x n ), jonka mukaan joko H 0 hyväksytään tai hylätään. Jos z S 0, niin H 0 hyväksytään. Jos taas z S 1, niin H 0 hylätään ja hyväksytään vastahypoteesi H 1. Alueeseen S 1 kuuluvat arvot ovat kriittisiä H 0 :n kannalta, joten sitä kutsutaan myös kriittiseksi alueeksi. Kriittinen alue valitaan siten, että testisuure Z saa siitä arvon H 0 :n ollessa oikea enintään todennäköisyydellä α, missä α on jokin pieni luku. Yleensä α = 0.05 tai α = 0.01. Lukua α sanotaan riskitasoksi tai merkitsevyystasoksi. Jukka Kemppainen Mathematics Division 9 / 35

Hypoteesin testauksen terminologiaa Jos esimerkiksi vastahypoteesi on H 1 : θ > θ 0, on kriittinen alue ]c, [, missä lukua c sanotaan kynnysarvoksi. Jos testimuuttujan arvo z c, hyväksytään H 0. Jos taas z > c, niin H 0 hylätään ja hyväksytään H 1. Tässä tapauksessa c valitaan siten, että P(Z > c H 0 : θ = θ 0 ) = α. Kaksisuuntaisen vastahypoteesin H 1 : θ θ 0 tapauksessa tarvitaan kaksi kynnysarvoa c 1 ja c 2. Kynnysarvot valitaan siten, että P(Z < c 1 H 0 ) = α 1 ja P(Z > c 2 H 0 ) = α 2, missä α 1 +α 2 = α. Yleensä α 1 = α 2. Jukka Kemppainen Mathematics Division 10 / 35

Hylkäysalueita eri hypoteeseille Väritetyn alueen x-koordinaatit muodostavat H 0 :n hylkäysalueen. Kuva : H 1 : θ 0 Kuva : H 1 : θ < 0 Kuva : H 1 : θ > 0 Huomaa, että jos yo. kuvien 1-suuntaisissa hypoteeseissa merkitsevyystaso on α, niin 2-suuntaisen hypoteesin merkitsevyystaso on 2α (pinta-ala on 2-kertainen). Jukka Kemppainen Mathematics Division 11 / 35

Testauksen virheistä Koska otoksen perusteella ei voida olla täysin varmoja koko populaatiota koskevissa päätelmissä, on mahdollisuus tehdä seuraavat virheet: 1. Hylätään oikea hypoteesi (tyypin I virhe). 2. Hyväksytään väärä hypoteesi (tyypin II virhe). Tarkastellaan hypoteesia H 0 : θ = θ 0 ja sen vastahypoteesia H 1 : θ > θ 0. Tyypin I virhe Hypoteesi H 0 on totta, mutta se hylätään, koska testimuuttuja Z saa arvon z > c. Virheen tn. on P(Z > c θ = θ 0 ) = α. Tyypin II virhe Hypoteesi H 0 ei ole totta, mutta se hyväksytään, koska testimuuttuja Z saa arvon z c. Virheen tn. on missä 0 < β < 1. P(Z c θ > θ 0 ) = β, Jukka Kemppainen Mathematics Division 12 / 35

Testauksen virheistä (1/2) Päätöksentekoa voidaan kuvata taulukolla Todellisuus Päätös H 0 tosi H 1 tosi H 0 oikea päätös II lajin virhe p = 1 α p = β H 1 I lajin virhe oikea päätös p = α p = 1 β Jukka Kemppainen Mathematics Division 13 / 35

Testauksen virheistä (2/2) Otetaan virheitä selventävä esimerkki jälleen oikeudesta. Esim. 36 Olkoot eräät nimeltä mainitsemattomat metsäyhtiöt syytteessä puukartellin järjestämisestä. (a) Mitä hypoteeseja testattiin, jos oikeus tekee I lajin virheen todetessaan metsäyhtiöt syyllisiksi? (b) Jos testattiin kohdan (a) hypoteeseja, niin mikä on II lajin virhe? (c) Kumpi virheistä on vakavampi? Jukka Kemppainen Mathematics Division 14 / 35

P-arvo Tilastolliset ohjelmistot tekevät päätöksenteon ns. p-arvon perusteella. Emme ole käyttäneet tällä kurssilla tätä menettelytapaa, sillä emme osaa laskea p-arvoa tärkeimmille tilastollisen testauksen jakaumille kuten χ 2 -, t- tai F-jakauma. Olkoon X testimuuttuja ja ˆx sen otoksessa saama arvo. P-arvo p tarkoittaa todennäköisyyttä p = P( X ˆx ), kun H 1 : θ θ 0 (2-suuntainen testi); p = P(X ˆx), kun H 1 : θ < θ 0 (1-suuntainen testi); p = P(X ˆx), kun H 1 : θ > θ 0 (1-suuntainen testi). Esimerkiksi χ 2 - ja F-testit ovat yksisuuntaisia testejä, joille p-arvo määrätään viimeisen kohdan perusteella. Jukka Kemppainen Mathematics Division 15 / 35

P-arvo Olkoon α testin merkitsevyystaso. Usein p-arvoa tulkitaan seuraavasti: Jos p α, niin H 0 :aa ei ole syytä hylätä merkitsevyystasolla α. Jos p < α, niin H 0 on syytä hylätä merkitsevyystasolla α. Siis mitä pienempi p-arvo on, niin sitä epätodennäköisempää on saada sattumalta havaittuja tai sitä harvinaisempia arvoja, jolloin havaintoja ei voi tulkita sattuman aiheuttamaksi. Jotkut käyttävät kiinteän rajan sijaan väljempää tulkintaa, mutta tärkeintä on ymmärtää p-arvon merkitys: P-arvo P-arvo antaa tn:n, että nollahypoteesin vallitessa saadaan havaittu tai sitä harvinaisempi arvo. Jukka Kemppainen Mathematics Division 16 / 35

P-arvo vs. kiinteä merkitsevyystaso Vaikka laskin usein ilmoittaa p-arvon ja se toisaalta voidaan laskimen avulla laskea numeerisesti integroimalla (useimpia testimuuttujia ei osata integroida analyyttisesti kuten tulemme näkemään), on hyvä osata päätöksenteko molemmilla tavoilla. Kiinteän merkitsevyystason käyttö on hieman vanhahtava tapa, mutta toisaalta tällä tavalla emme tarvitse niin suurta laskentakapasiteettia. Kuten aiemminkin on tullut todettua: Funktiolaskimella ja taulukoillakin pärjää. Jukka Kemppainen Mathematics Division 17 / 35

Yhden otoksen testejä Tarkastellaan seuraavassa yhteen otokseen perustuvia jakauman parametreja koskevia testejä. Testimenetelmät pohjautuvat normaalijakaumaan tai johonkin siitä johdettuun jakaumaan. Lisäksi, jos otoskoko on riittävän suuri, voidaan hyödyntää keskeistä raja-arvolausetta. Tällä kurssilla testattavat parametrit ovat odotusarvo, varianssi (tai keskihajonta). Jukka Kemppainen Mathematics Division 18 / 35

Z-testi Z-testi soveltuu normaalijakautuneelle satunnaismuuttujalle X, jonka hajonta σ X tunnetaan. Tyyppiesimerkiksi käy normaalijakautuneen satunnaismuuttujan X N(µ,σ 2 ) odotusarvon testaus. Olkoon (x 1,...,x n ) otos normaalijakaumasta N(µ,σ 2 ). Havaintojen x i voidaan katsoa olevan riippumattomien satunnaismuuttujien X i realisaatioita. Odotusarvon µ harhaton estimaattori on keskiarvo X = 1 n n i=1 X i, joka on normaalijakautunut odotusarvolla µ ja keskihajonnalla σ/ n. Tällöin Z = X µ N(0,1). σ n Jukka Kemppainen Mathematics Division 19 / 35

Z-testi Olkoon riskitaso α ja olkoon testattava hypoteesi H 0 : µ = µ 0 ja sen vastahypoteesi H 1 : µ < µ 0. Määrätään kynnysarvo r 0 siten, että P(Z r 0 ) = 1 α. Koska 1 α on lähellä ykköstä, on r 0 negatiivinen ja siten r 0 :aa ei löydy normaalijakauman taulukosta. Käyttämällä symmetriaominaisuutta P(Z r 0 ) = 1 α P(Z r 0 ) = Φ( r 0 ) = 1 α, saadaan luku r 0 luettua taulukosta ja siten r 0 tulee määrätyksi. Lasketaan otoksesta testimuuttujan z arvo x µ 0 σ/ n. Jos z > r 0, hyväksytään H 0 ja todetaan, että H 0 on tosi riskitasolla α. Muussa tapauksessa H 0 hylätään ja siten hyväksytään H 1. Jukka Kemppainen Mathematics Division 20 / 35

Esimerkki Esim. 37 Olkoon X normaalijakautunut satunnaismuuttuja, jonka varianssi on σ 2 = 9. Käyttämällä otoskokoa n = 10 ja keskiarvoa x testaa hypoteesi H 0 : µ = µ 0 = 24 riskitasolla α = 0.05, kun vastahypoteesi on (a) µ > µ 0, (b) µ < µ 0, (c) µ µ 0. Jukka Kemppainen Mathematics Division 21 / 35

Suhteellisen osuuden testi Z-testiä voidaan soveltaa myös suurilla aineistoilla satunnaismuuttujille, jotka eivät normaalijakautuneita. Perusteluna tälle on keskeinen raja-arvolause. Tarkastellaan esimerkkinä binomijakautuneen sm:n X Bin(n, p) parametrin p testausta. Parametrin p harhaton estimaattori on Θ = X n. Keskeisen raja-arvolauseen mukaan Θ on likimain normaalijakautunut, ( Θ N p, p(1 p) ) n likimain, kun n on riittävän suuri. Olkoon testattava hypoteesi H 0 : p = p 0 ja sen vastahypoteesi H 1 : p > p 0. Jukka Kemppainen Mathematics Division 22 / 35

Suhteellisen osuuden testi Valitaan testisuureeksi Z = X n p 0 p 0 (1 p 0 ) n N(0,1). Olkoon riskitaso α. Luetaan normaalijakauman taulukosta sellainen kynnysarvo r 0, että P(Z r 0 ) = Φ(r 0 ) = 1 α. Jos suhteellisen osuuden havaittu arvo on ˆp, niin testimuuttujan arvoksi saadaan z = ˆp p 0 p 0 (1 p 0 ) n Jos z r 0, niin H 0 hyväksytään. Jos taas z > r 0, hylätään H 0 ja hyväksytään H 1. Jukka Kemppainen Mathematics Division 23 / 35.

Esimerkkejä Esim. 38 Tarkastellaan poikien syntyvyyttä aineistossa, jossa n = 3000 ja poikien lukumäärä on 1578. Olkoon p poikien suhteellinen osuus syntyneistä lapsista. Valitse nollahypoteesiksi H 0 : p = 0.5. Voidaanko otoksen perusteella sanoa riskitasolla α = 0.01, että poikien suhteellinen osuus on suurempi kuin tyttöjen? Esim. 39 Testaa esimerkin 35 hypoteesit tapauksessa, jossa tutkittiin n = 200 työssäkäyvää, joista 132 oli korkeasti koulutettuja. Valitse riskitasoksi α = 0.05. Jukka Kemppainen Mathematics Division 24 / 35

T-testi T-testi soveltuu normaalijakautuneelle satunnaismuuttujalle X, jonka hajontaa ei tunneta. Tyyppiesimerkkinä tarkastellaan normaalijakautuneen sm:n X N(µ,σ 2 ) odotusarvon testiä. Olkoon (x 1,...,x n ) satunnaisotos X:stä. Otoksesta saadaan odotusarvon ja varianssin harhattomat estimaatit x = 1 n n x i, i=1 s 2 = 1 n 1 n (x i x) 2. i=1 Olkoot X ja S 2 otostunnuslukuja vastaavat estimaattorit. Lauseen?? mukaan T = X µ S n t n 1. Jukka Kemppainen Mathematics Division 25 / 35

T-testi Olkoon riskitaso α ja olkoon testattava hypoteesi H 0 : µ = µ 0 ja sen vastahypoteesi H 1 : µ > µ 0. Luetaan t-jakauman taulukosta yksisuuntaisen testin kohdalta kynnysarvo r 0 siten, että P(T r 0 ) = 1 α. Lasketaan otoksesta testimuuttujan T arvo t = x µ 0 s/ n. Jos t r 0, hyväksytään H 0. Jos taas t > r 0, hylätään H 0 ja siten hyväksytään H 1. Kaksisuuntaisen testin tapauksessa hypoteesit ovat H 0 : µ = µ 0 ja H 1 : µ µ 0. Tällöin (symmetrisessä tapauksessa) luetaan t-jakauman taulukosta kynnysarvo r 0 siten, että P( r 0 T r 0 ) = 1 α. Jos testimuuttujan arvo t = x µ 0 s/ n [ r 0,r 0 ], hyväksytään H 0. Muussa tapauksessa H 0 hylätään ja siten hyväksytään H 1. Jukka Kemppainen Mathematics Division 26 / 35

Esimerkkejä Esim. 40 Valmistaja ilmoittaa erään monofiilisiiman vetolujuudeksi 8.0 [kg]. Testataan H 0 : µ = 8.0 vastaan H 1 : µ 8.0. Testiä varten otettiin n = 10 siimanäytettä ja määritettiin niistä vetolujuudet. Saatiin seuraavat tulokset 8.1; 7.8; 7.9; 8.3; 8.0; 8.5; 8.2; 8.1; 8.2; 8.4. Voidaanko aineiston perusteella luottaa valmistajan ilmoitukseen vetolujuudesta riskitasolla α = 0.05? Jukka Kemppainen Mathematics Division 27 / 35

Esimerkkejä Esim. 41 Eräässä supermarketissa myydään lihaa yhden paunan [lb] (1 lb 0.45 kg) pakkauksissa. Otettiin 35 pakkauksen satunnaisotanta, jonka perusteella otoskeskiarvo oli 1.01 ja otoskeskihajonta 0.18 paunaa. (a) Jos olisit laadusta vastaava johtaja ja haluaisit olla varma, että pakkauksen keskipaino on todella 1 paunan, mitä hypoteesia testaisit? (b) Testaa asettamasi hypoteesi sopivalla testillä. (c) Miten informoisit firman osakkaita saaduista tuloksista? Jukka Kemppainen Mathematics Division 28 / 35

Kahden otoksen testejä Tarkastellaan seuraavassa kahteen eri otokseen perustuvia jakauman parametreja koskevia testejä. Testimenetelmät pohjautuvat jälleen normaalijakaumaan tai johonkin siitä johdettuun jakaumaan. Lisäksi, jos otoskoko on riittävän suuri, voidaan hyödyntää keskeistä raja-arvolausetta. Käsitellään ainoastaan odotusarvojen vertailua toisiinsa. Otokset voivat olla joko riippumattomat tai riippuvia toisistaan (parittainen vertailu). Odotusarvojen vertailu tehdään odotusarvojen erotuksen avulla. Jukka Kemppainen Mathematics Division 29 / 35

Odotusarvojen erotuksen testi, hajonnat tunnetaan Odotusarvojen erotuksen testiä käytetään esimerkiksi tilanteessa, jossa halutaan vertailla kahden eri valmistusmenetelmän vaikutusta tuotteen laatuun. Olkoot X N(µ 1,σ1 2) ja Y N(µ 2,σ2 2 ) riippumattomia sm:ia sekä (x 1,...,x n1 ) ja (y 1,...,y n2 ) riippumattomat otokset X:stä ja Y :stä. Odotusarvojen vertailussa tarkastellaan erotusta µ 1 µ 2, jonka harhaton estimaattori on aritmeettisten keskiarvojen erotus X Y, joka noudattaa normaalijakaumaa X Y N(µ 1 µ 2, σ2 1 n 1 + σ2 2 n 2 ). Testataan H 0 : µ 1 µ 2 = 0 vastaan H 1 : µ 1 µ 2 0. Jukka Kemppainen Mathematics Division 30 / 35

Odotusarvojen erotuksen testi, σ 1 ja σ 2 tunnettu Testimuuttujaksi käy Z = X Y (µ 1 µ 2 ) σ 2 1 n 1 + σ2 2 n 2 N(0,1). Lasketaan otoksesta x = 1 n1 n 1 i=1 x i ja y = 1 n2 n 2 i=1 y i ja testimuuttujan arvo z = x y. σ 2 1 n 1 + σ2 2 n 2 Huomaa, että µ 1 µ 2 = 0 H 0 :n vallitessa. Asetetaan riskitaso α ja määrätään normaalijakauman taulukosta kynnysarvo r 0 siten, että P( Z r 0 ) = 1 α. Jos testimuuttujan arvo z [ r 0,r 0 ], niin H 0 hyväksytään. Muussa tapauksessa H 0 hylätään ja siten H 1 hyväksytään. Jukka Kemppainen Mathematics Division 31 / 35

Odotusarvojen erotuksen testi, σ 1 ja σ 2 tuntemattomia Jos σ 1 ja σ 2 ovat tuntemattomia, täytyy ne estimoida havaintoaineistosta. Voidaan osoittaa, että tässä tapauksessa T = X Y (µ 1 µ 2 ) 1 n 1 + 1 (n1 1)s1 2+(n 2 1)s2 2 n 2 n 1 +n 2 2 t n1 +n 2 2. Lasketaan otoksesta kuten edellä x ja y sekä otosvarianssit s 2 1 = 1 n 1 1 s 2 2 = 1 n 2 1 n 1 i=1 n 2 (x i x) 2, (y i y) 2. i=1 Jukka Kemppainen Mathematics Division 32 / 35

Odotusarvojen erotuksen testi, σ 1 ja σ 2 tuntemattomia Testataan H 0 : µ 1 µ 2 = 0 vastaan H 1 : µ 1 µ 2 0 ja asetetaan riskitasoksi α. Määrätään t-jakauman taulukosta kaksisuuntaisen testin kohdalta kynnysarvo r 0 siten, että P( T r 0 ) = 1 α. Hypoteesin H 0 vallitessa testimuuttujan arvo on t = x y 1 n 1 + 1 (n1 1)s1 2+(n 2 1)s2 2 n 2 n 1 +n 2 2 t n1 +n 2 2. Jos t r 0, niin H 0 hyväksytään. Jos taasen t > r 0, niin H 0 hylätään ja siten H 1 hyväksytään. Yksisuuntaisen testin tapauksessa vastahypoteesi on joko H 1 : µ 1 µ 2 > 0 tai H 1 : µ 1 µ 2 < 0. Analyysi tehdään samaan tapaan kuin edellä. Jukka Kemppainen Mathematics Division 33 / 35

Odotusarvojen erotuksen testi, σ 1 ja σ 2 tuntemattomia Edellä esitetty menetelmä pätee itse asiassa vain tapauksessa σ 1 = σ 2, eli joudumme olettamaan, että varianssit ovat samat. Menetelmä on kuitenkin suhteellisen joustava. Nyrkkisääntönä voidaan käyttää ehtoa max{s 2 1,s2 2 } min{s 2 1,s2 2 } 3. Jos ehto on voimassa, niin sovitaan, että edellä esitettyä menetelmää voidaan käyttää. Käytännössä itse asiassa voimme testata varianssien yhtäsuuruutta ja päättää sen perusteella kumpaa menetelmää käytetään. Ei puututa kuitenkaan tällä kurssilla tähän. Jukka Kemppainen Mathematics Division 34 / 35

Esimerkki Esim. 42 Testattiin kahden eri materiaalin abrasiivista kulumista. Materiaalista 1 testattiin 12 koepalaa ja materiaalista 2 testattiin 10 koepalaa. Materiaalin 1 otos antoi keskimääräiseksi (koodatuksi) kulumiseksi 85 yksikköä ja keskihajonnaksi 4 yksikköä. Materiaalin 2 otos antoi keskimääräiseksi kulumiseksi 81 yksikköä ja keskihajonnaksi 5 yksikköä. Testaa riskitasolla α = 5%, onko materiaalin 1 kuluminen suurempaa kuin materiaalin 2 kuluminen. Jukka Kemppainen Mathematics Division 35 / 35