VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170

Samankaltaiset tiedostot
Väliestimointi (jatkoa) Heliövaara 1

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

Sovellettu todennäköisyyslaskenta B

Jos nollahypoteesi pitää paikkansa on F-testisuuren jakautunut Fisherin F-jakauman mukaan

11. laskuharjoituskierros, vko 15, ratkaisut

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu

χ = Mat Sovellettu todennäköisyyslasku 11. harjoitukset/ratkaisut

806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy (1 α) = 99 1 α = 0.

Sovellettu todennäköisyyslaskenta B

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu

ABHELSINKI UNIVERSITY OF TECHNOLOGY

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Mat Sovellettu todennäköisyyslasku A

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu

Johdatus varianssianalyysiin. Vilkkumaa / Kuusinen 1

r = n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit.

Estimointi. Vilkkumaa / Kuusinen 1

Harjoitus 7: NCSS - Tilastollinen analyysi

χ 2 -yhteensopivuustestissä käytetään χ 2 -testisuuretta χ = Mat Sovellettu todennäköisyyslasku A

Testejä suhdeasteikollisille muuttujille

Gripenberg. MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Tentti ja välikoeuusinta

¼ ¼ joten tulokset ovat muuttuneet ja nimenomaan huontontuneet eivätkä tulleet paremmiksi.

1. Nollahypoteesi on, että teksti on kirjoitettu lyhyemmällä murteella. Mahdollisiavaihtoehtojaonvainyksieliettäteksti

Sovellettu todennäköisyyslaskenta B

Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2005) 1

Mat Tilastollisen analyysin perusteet, kevät 2007

Todennäköisyyden ominaisuuksia

Tutkimusongelmia ja tilastollisia hypoteeseja: Perunalastupussien keskimääräinen paino? Nollahypoteesi Vaihtoehtoinen hypoteesi (yksisuuntainen)

Mat Tilastollisen analyysin perusteet, kevät 2007

edellyttää valintaa takaisinpanolla Aritmeettinen keskiarvo Jos, ½ Ò muodostavat satunnaisotoksen :n jakaumasta niin Otosvarianssi Ë ¾

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B

Odotusarvoparien vertailu. Vilkkumaa / Kuusinen 1

Sovellettu todennäköisyyslaskenta B

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin

Kynä-paperi -harjoitukset. Taina Lehtinen Taina I Lehtinen Helsingin yliopisto

Sovellettu todennäköisyyslaskenta B

Mat Tilastollisen analyysin perusteet, kevät 2007

10. laskuharjoituskierros, vko 14, ratkaisut

c) A = pariton, B = ainakin 4. Nyt = silmäluku on5 Koska esim. P( P(A) P(B) =, eivät tapahtumat A ja B ole riippumattomia.

riippumattomia ja noudattavat samaa jakaumaa.

Estimointi populaation tuntemattoman parametrin arviointia otossuureen avulla Otossuure satunnaisotoksen avulla määritelty funktio

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1

Yhteensopivuuden, homogeenisuuden ja riippumattomuuden testaaminen

Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1

Johdatus tilastotieteeseen Tilastolliset testit. TKK (c) Ilkka Mellin (2005) 1

Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen., jos otoskeskiarvo on suurempi kuin 13,96. Mikä on testissä käytetty α:n arvo?

MTTTP5, luento Kahden jakauman sijainnin vertailu (jatkoa) Tutkimustilanteita y = neliöhinta x = sijainti (2 aluetta)

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

HAVAITUT JA ODOTETUT FREKVENSSIT

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 6. luento. Pertti Palo

pisteet Frekvenssi frekvenssi Yhteensä

Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1

Tilastollinen aineisto Luottamusväli

Johdatus tilastotieteeseen Yhteensopivuuden, homogeenisuuden ja riippumattomuuden testaaminen. TKK (c) Ilkka Mellin (2004) 1

MTTTP5, luento Otossuureita ja niiden jakaumia (jatkuu)

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Jos nyt on saatu havaintoarvot Ü ½ Ü Ò niin suurimman uskottavuuden

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

2. Keskiarvojen vartailua

3. a) Mitkä ovat tilastolliset mitta-asteikot? b) Millä tavalla nominaaliasteikollisen muuttujan jakauman voi esittää?

Tilastollisen analyysin perusteet Luento 5: Jakaumaoletuksien. testaaminen

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

Sisällysluettelo ESIPUHE... 4 ALKUSANAT E-KIRJA VERSIOON... 5 SISÄLLYSLUETTELO JOHDANTO TILASTOLLISEEN PÄÄTTELYYN TODENNÄKÖISYYS...

Sovellettu todennäköisyyslaskenta B

Mat Sovellettu todennäköisyyslasku A. Moniulotteiset jakaumat. Avainsanat:

MAT Todennäköisyyslaskenta Tentti / Kimmo Vattulainen

1. Tilastollinen malli??

031021P Tilastomatematiikka (5 op) viikko 5

/1. MTTTP5, luento Normaalijakauma (jatkuu) Binomijakaumaa voidaan approksimoida normaalijakaumalla

Tilastollisen analyysin perusteet Luento 6: Korrelaatio ja riippuvuus tilastotieteessä

Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

dx=5&uilang=fi&lang=fi&lvv=2014

Tilastotieteen kertaus. Kuusinen/Heliövaara 1

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

Valitaan testisuure, jonka jakauma tunnetaan H 0 :n ollessa tosi.

/1. MTTTP1, luento Normaalijakauma (jatkoa) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti:

4. Seuraavaan ristiintaulukkoon on kerätty tehtaassa valmistettujen toimivien ja ei-toimivien leikkijunien lukumäärät eri työvuoroissa:

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Käytetään satunnaismuuttujaa samoin kuin tilastotieteen puolella:

Todennäköisyyslaskun kertaus. Vilkkumaa / Kuusinen 1

/1. MTTTP1, luento Normaalijakauma (kertausta) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti:

Kaksisuuntainen varianssianalyysi. Vilkkumaa / Kuusinen 1

Testit laatueroasteikollisille muuttujille

Sisällysluettelo ESIPUHE KIRJAN 1. PAINOKSEEN...3 ESIPUHE KIRJAN 2. PAINOKSEEN...3 SISÄLLYSLUETTELO...4

tilastotieteen kertaus

/1. MTTTP5, luento Kertausta. Olk. X 1, X 2,..., X n on satunnaisotos N(µ, ):sta, missä tunnettu. Jos H 0 on tosi, niin

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi. Viikko 5

Tilastolliset testit. Tilastolliset testit. Tilastolliset testit: Mitä opimme? 2/5. Tilastolliset testit: Mitä opimme? 1/5

Mat Sovellettu todennäköisyyslasku A

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

Otoskeskiarvo on otossuure, jonka todennäköisyysjakauma tiedetään. Se on normaalijakauma, havainnollistaminen simuloiden

Tilastollinen testaaminen tai Tilastollinen päättely. Geneettinen analyysi

Kaksisuuntainen varianssianalyysi. Heliövaara 1

/1. MTTTP5, luento Normaalijakauma (jatkuu) Binomijakaumaa voidaan approksimoida normaalijakaumalla

Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus KE (2014) 1

6.1.2 Yhdessä populaatiossa tietyn tyyppisten alkioiden prosentuaalista osuutta koskeva päättely

Normaalijakaumasta johdettuja jakaumia

Transkriptio:

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE 4.6.2013 Ratkaisut ja arvostelu 1.1 Satunnaismuuttuja X noudattaa normaalijakaumaa a) b) c) d) N(170, 10 2 ). Tällöin P (165 < X < 175) on likimain a) 0.38 b) 0.21 c) 0.29 d) 0.43 ( 165 170 P (165 < X < 175) = P < X 170 ) 175 170 < 10 10 10 = P ( 0.5 < Z < 0.5) = Φ(0.5) Φ( 0.5) = Φ(0.5) (1 Φ(0.5)) = 2Φ(0.5) 1, jossa Z = (X 170)/10 noudattaa standardoitua normaalijakaumaa N(0, 1) ja Φ(x) on standardoidun normaalijakauman kertymäfunktio. Liitteen perusteella Φ(0.5) = 0.6915, joten P (165 < X < 175) = 2Φ(0.5) 1 = 2 0.6915 1 = 1.383 1 = 0.383 0.38. 1.2 Pearsonin korrelaatiokerroin a) mittaa sekä lineaarista että epälineaarista riippuvuutta b) voidaan laskea vähintään nominaaliasteikollisille muuttujille c) mittaa ainoastaan lineaarista riippuvuutta d) on keskiluku 1.3 Lukujen 1, 4, 7, 5, 3 varianssi on a) 2.4 b) 5.0 c) 3.8 d) 4.4 ȳ = 1 n s 2 = = 1 n 1 y i = 1 (1 + 4 + 7 + 5 + 3) = 20/5 = 4. 5 (y i ȳ) 2 1 5 1 ((1 4)2 + (4 4) 2 + (7 4) 2 + (5 4) 2 + (3 4) 2 ) = 1 4 (9 + 0 + 9 + 1 + 1) = 20 4 = 5. 1

1.4 Henkilöt A, B ja C hakevat samaa työpaikkaa. Henkilöillä A ja B on samat todennäköisyydet saada paikka. Henkilö C saa paikan 3 kertaa todennäköisemmin kuin henkilö A. Paikkaan valitaan henkilö A, B tai C. Millä todennäköisyydellä henkilö B ei saa paikkaa? a) 4/5 b) 1/5 c) 5/7 d) 6/7 Olkoon P (A) = P ( Henkilö A saa paikan ) P (B) = P ( Henkilö B saa paikan ) P (C) = P ( Henkilö C saa paikan ) Tehtävänannon perusteella ja P (A) = P (B), P (C) = 3P (A) = 3P (B) P (A) + P (B) + P (C) = 1. Kun sijoitetaan P (A) = P (B) ja P (C) = 3P (B) kolmanteen yhtälöön, niin saadaan P (B) + P (B) + 3P (B) = 1 5P (B) = 1 P (B) = 1/5. Henkilö B ei saa paikkaa todennäköisyydellä P (B C ) = 1 P (B) = 1 1/5 = 4/5. 1.5 Tarkastellaan erästä painotettua noppaa ja siihen liittyvää satunnaismuuttujaa X = "Nopan silmäluku yhdellä heitolla". Oletetaan, että P (X = 6) = 0.25 ja P (X = i) = 0.15, i = 1,..., 5. Satunnaismuuttujan X odotusarvo on a) 3.85 b) 3.5 c) 3.75 d) 4 E(X) = 6 i P (X = i) = (1 + 2 + 3 + 4 + 5) 0.15 + 6 0.25 = 15 0.15 + 1.5 = 2.25 + 1.5 = 3.75. 2

1.6 Laatikossa on 3 valkoista ja 5 sinistä palloa. Siitä nostetaan peräkkäin 3 palloa palauttamatta. Mikä on todennäköisyys, että kaikki nostetut pallot ovat samanvärisiä? a) 1/56 b) 13/112 c) 1/7 d) 11/56 ( 3 P ( Nostetut pallot ovat valkoisia ) = ( 3) 8 ) = 3 8 2 7 1 6 = 1 56. 3 ( 5 P ( Nostetut pallot ovat sinisiä ) = ( 3) 8 ) = 5 8 4 7 3 6 = 10 56. 3 P ( Nostetut pallot ovat samanvärisiä ) = 1 56 + 10 56 = 11 56. PISTEYTYS: 0.5 pistettä/kysymys 3

2. Tehdas valmistaa pultteja, joiden pituus vaihtelee hieman satunnaisien tekijöiden takia. Tasalaatuisuuden tutkimiseksi tehtaan valmistamista pulteista otettiin 100 kappaleen satunnaisotos. Otoksesta saatiin seuraavat mittaustulokset: keskiarvo x = 105.5 mm ja keskihajonta s = 20 mm. Laske pulttien pituuden odotusarvolle 95 %:n luottamusväli, kun oletetaan, että pulttien pituudet noudattavat likimain normaalijakaumaa. Kun havainnot x 1,..., x n tulevat normaalijakaumasta N(µ, σ 2 ), niin odotusarvon µ 95% luottamusväli on ( x t n 1 (0.025) s, x + t n 1 (0.025) s ), n n jossa x = 1 n x i, s 2 = 1 n 1 (x i x) 2 ja t n 1 (0.025) on se piste, jonka oikealla puolella on 2.5% jakauman t n 1 (eli t- jakauma vapausasteilla n 1) todennäköisyysmassasta. Huom! Jakauman odotusarvo µ ja varianssi σ 2 ovat siis tuntemattomia. Havaintoaineiston koko on n = 100, joten t-jakaumalla on vapausasteita df = n 1 = 99. Taulukon perusteella t 99 (0.025) 1.9840. Pulttien pituuden odotusarvon 95 %:n luottamusväliksi saadaan ( 105.5 1.9840 20, 105.5 + 1.9840 20 ) = (105.5 1.9840 2, 105.5 + 1.9840 2) 100 100 = (105.5 3.968, 105.5 + 3.968) = (105.5 3.968, 105.5 + 3.968) = (101.532, 109.469) (101.5, 109.5). Huom! Saadulla luottamusvälillä ei ole mitään todennäköisyystulkintaa! Ei voi sanoa, että odotusarvo kuuluu saadulle luottamusvälille (101.5, 109.5) 95% todennäköisyydellä. PISTEYTYS: max 4 pistettä. Vastauksesta vähennetty 0.5 pistettä, jos t-jakauman sijasta on käytetty normaaliapproksimaatiota. Normaaliapproksimaation käyttö voisi olla perusteltua silloin kun t-jakaumataulukkoa ei ole käytettävissä. 4

3. Eräs yritys väittää, että heidän myymissään lisäainepillereissä on C-vitamiinia 500 mg. Väitteen testaamiseksi otettiin 100 pillerin satunnaisotos. Pillereistä mitatuista C-vitamiinimääristä saatiin seuraavat tulokset: keskiarvo x = 450 mg ja keskihajonta s = 200 mg. Testaa yksisuuntaisen t-testin avulla yrityksen väitteen paikkaansapitävyyttä, kun vastahypoteesina on H 1 : "C-vitamiinipitoisuus < 500 mg". Käytä 1% merkitsevyystasoa. Oletetaan, että lisäainepillerien C-vitamiinimäärä noudattaa normaalijakaumaa N(µ, σ 2 ) ja tarkastellaan yksisuuntaista testausasetelmaa eli H 0 : µ = 500 mg vastaan H 1 : µ < 500 mg H 0 : C-vitamiinipitoisuus = 500 mg vastaan H 1 : C-vitamiinipitoisuus < 500 mg Testisuureena käytetään t-testisuuretta T = x 500 s/ n, joka noudattaa t n 1 -jakaumaa eli t-jakaumaa vapausastein n 1 = 99, kun nollahypoteesi on tosi. Testisuureen pienet havaitut arvot puoltavat vastahypoteesia H 1. Testisuureen T havaituksi arvoksi saadaan 450 500 t = 200/ 100 = 50 20 = 2.5. Jakaumataulukosta nähdään, että P (T 2.3642) 0.01, joten havaittu arvo t = 2.5 kuuluu kriittiselle alueella ja näin ollen nollahypoteesi H 0 voidaan hylätä merkitsevyystasolla 0.01=1%. Vaikuttaa siltä, että pillereiden keskimääräinen C-vitamiinipitoisuus on pienempi kuin yrityksen antama arvo. PISTEYTYS: max 5 pistettä. Vastauksesta vähennetty 0.5 pistettä, jos t-jakauman sijasta on käytetty normaaliapproksimaatiota. Normaaliapproksimaation käyttö voisi olla perusteltua silloin kun t-jakaumataulukkoa ei ole käytettävissä. 5

4. Eräässä kokeessa kolme arvostelijaa A, B ja C hyväksyi ja hylkäsi suorituksia seuraavasti: A B C hyväksytty 50 60 40 hylätty 50 40 60 a) Testaa χ 2 -riippumattomuustestin avulla riippuuko suorituksen tulos arvostelijasta. Käytä 5 % merkitsevyystasoa b) Muotoile nollahypoteesi H 0 ja vastahypoteesi H 1. c) Anna myös sanallinen tulkinta saamallesi tulokselle. a) Lasketaan havaittujen frekvenssien taulukosta rivisummat r i, sarakesummat c i ja kokonaislukumäärä n: A B C Σ hyväksytty o 11 =50 o 12 =60 o 13 =40 r 1 =150 hylätty o 21 =50 o 22 =40 o 23 =60 r 2 =150 Σ c 1 =100 c 2 =100 c 3 =100 n = 300 Odotetut frekvenssit saadaan laskettua rivi- ja sarakesummien avulla: e ij = r ic j n Tarkastellaan testausasetelmaa = 150 100 300 = 50, i = 1, 2, j = 1, 2, 3. H 0 : Suorituksen tulos ei riipu arvostelijasta vastaan H 1 : Suorituksen tulos riippuu arvostelijasta Testisuureena käytetään χ 2 -testisuuretta n r n c χ 2 = j=1 (o ij e ij ) 2 e ij, joka noudattaa χ 2 -jakaumaa vapausastein df = (n r 1)(n c 1), kun nollahypoteesi on tosi. Testisuureen suuret arvot puoltavat vastahypoteesia. Nyt taulukossa on rivejä n r = 2 ja sarakkeita n c = 3, joten testisuure on χ 2 - jakautunut vapausastein df = (2 1)(3 1) = 2. Testisuureen havaituksi arvoksi saadaan (50 50) 2 (60 50)2 (40 50)2 + + + 50 50 50 = 0 + 2 + 2 + 0 + 2 + 2 = 8. (50 50)2 50 + (40 50)2 50 + (60 50)2 50 6

Jakaumataulukosta nähdään, että P (χ 2 5.991) = 0.05, joten testisuureen havaittu arvo 8 kuuluu kriittiselle alueelle ja nollahypoteesi voidaan hylätä merkitsevyystasolla 5% = 0.05. b) Sama kuin a)-kohdassa: H 0 : Suorituksen tulos ei riipu arvostelijasta vastaan H 1 : Suorituksen tulos riippuu arvostelijasta c) χ 2 -testin perusteella on melko epätodennäköistä, että kyseinen aineisto saataisiin nollahypoteesin pätiessä. Vaikuttaa siltä, että suorituksen tulos riippuu arvostelijasta. PISTEYTYS: a) max 4 pistettä, b) max 1 piste. Vastauksesta vähennetty vähintään 0.5 pistettä, jos hypoteesissa käytetty havaittuja frekvenssejä, b) max 1 piste. 7