4. Seuraavaan ristiintaulukkoon on kerätty tehtaassa valmistettujen toimivien ja ei-toimivien leikkijunien lukumäärät eri työvuoroissa:



Samankaltaiset tiedostot
Leikkijunan kunto toimiva ei-toimiva Työvuoro aamuvuoro päivävuoro iltavuoro

3. a) Mitkä ovat tilastolliset mitta-asteikot? b) Millä tavalla nominaaliasteikollisen muuttujan jakauman voi esittää?

1. Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet

1.Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet

KURSSIKYSELYAINEISTO: HUOM! Aineiston tilastoyksikkömäärä 11 on kovin pieni oikean tilastotieteen tekemiseen, mutta Harjoitteluun se kelpaa kyllä!

Til.yks. x y z

pisteet Frekvenssi frekvenssi Yhteensä

Sovellettu todennäköisyyslaskenta B

c) A = pariton, B = ainakin 4. Nyt = silmäluku on5 Koska esim. P( P(A) P(B) =, eivät tapahtumat A ja B ole riippumattomia.

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

Ennen seuraavia tehtäviä tarkista, että KUNNAT-aineistossasi on 12 muuttujaa ja 416 tilastoyksikköä.

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

Esim. Pulssi-muuttujan frekvenssijakauma, aineisto luentomoniste liite 4

Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen., jos otoskeskiarvo on suurempi kuin 13,96. Mikä on testissä käytetty α:n arvo?

Tilastollinen aineisto Luottamusväli

Ennen seuraavia tehtäviä tarkista, että KUNNAT-aineistossasi on 12 muuttujaa ja 416 tilastoyksikköä.

Kvantitatiiviset tutkimusmenetelmät maantieteessä

806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy (1 α) = 99 1 α = 0.

Til.yks. x y z

Tilastotieteen kertaus. Kuusinen/Heliövaara 1

Mat Tilastollisen analyysin perusteet. Tilastollisten aineistojen kerääminen ja mittaaminen Tilastollisten aineistojen kuvaaminen Väliestimointi

Näistä standardoiduista arvoista laskettu keskiarvo on nolla ja varianssi 1, näin on standardoidulle muuttujalle aina.

Väliestimointi (jatkoa) Heliövaara 1

tilastotieteen kertaus

Estimointi. Vilkkumaa / Kuusinen 1

A130A0650-K Tilastollisen tutkimuksen perusteet 6 op Tentti / Anssi Tarkiainen & Maija Hujala

dx=5&uilang=fi&lang=fi&lvv=2014

Luento KERTAUSTA Kaksiulotteinen jakauma Pisteparvi, Toyota Avensis -farmariautoja

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

Sovellettu todennäköisyyslaskenta B

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Harjoittele tulkintoja

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu

riippumattomia ja noudattavat samaa jakaumaa.

/1. MTTTP5, luento Normaalijakauma (jatkuu) Binomijakaumaa voidaan approksimoida normaalijakaumalla

Näistä standardoiduista arvoista laskettu keskiarvo on nolla ja varianssi 1, näin on standardoidulle muuttujalle aina.

Sovellettu todennäköisyyslaskenta B

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1

ABHELSINKI UNIVERSITY OF TECHNOLOGY

Tutkimusongelmia ja tilastollisia hypoteeseja: Perunalastupussien keskimääräinen paino? Nollahypoteesi Vaihtoehtoinen hypoteesi (yksisuuntainen)

MTTTP5, luento Luottamusväli, määritelmä

Tulkitse tulokset. Onko muuttujien välillä riippuvuutta? Jos riippuvuutta on, niin millaista se on?

Estimointi populaation tuntemattoman parametrin arviointia otossuureen avulla Otossuure satunnaisotoksen avulla määritelty funktio

MTTTP1, luento KERTAUSTA

1 TILASTOJEN KÄYTTÖ 7. Mitä tilastotiede on 7 Historiaa 8 Tilastotieteen nykyinen asema 9 Tilastollisen tutkimuksen vaiheet 10

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

MTTTP5, luento Otossuureita ja niiden jakaumia (jatkuu)

/1. MTTTP5, luento Normaalijakauma (jatkuu) Binomijakaumaa voidaan approksimoida normaalijakaumalla

HAVAITUT JA ODOTETUT FREKVENSSIT

Lisätehtäviä ratkaisuineen luentomonisteen lukuihin 2-4 liittyen

/1. MTTTP1, luento Normaalijakauma (jatkoa) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti:

Miten voidaan arvioida virheellisten komponenttien osuutta tuotannossa? Miten voidaan arvioida valmistajan kynttilöiden keskimääräistä palamisaikaa?

Mat Tilastollisen analyysin perusteet, kevät 2007

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 6. luento. Pertti Palo

Kynä-paperi -harjoitukset. Taina Lehtinen Taina I Lehtinen Helsingin yliopisto

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu

Kandidaatintutkielman aineistonhankinta ja analyysi

/1. MTTTP1, luento Normaalijakauma (kertausta) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti:

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Otoskoko 107 kpl. a) 27 b) 2654

Valitaan testisuure, jonka jakauma tunnetaan H 0 :n ollessa tosi.

r = n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit.

1. Normaalisuuden tutkiminen, Bowmanin ja Shentonin testi, Rankit Plot, Wilkin ja Shapiron testi

POPULAATIO. Oikeastaan arvot, joista ollaan kiinnostuneita (mitatut numeeriset suureet, luokittelut).

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

SISÄLTÖ 1 TILASTOJEN KÄYTTÖ...7 MITÄ TILASTOTIEDE ON?

Kaavakokoelma, testikaaviot ja jakaumataulukot liitteinä. Ei omia taulukoita! Laskin sallittu.

Sovellettu todennäköisyyslaskenta B

MTTTP1, luento KERTAUSTA

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

¼ ¼ joten tulokset ovat muuttuneet ja nimenomaan huontontuneet eivätkä tulleet paremmiksi.

Mat Tilastollisen analyysin perusteet, kevät 2007

Tavanomaisten otostunnuslukujen, odotusarvon luottamusvälin ja Box ja Whisker -kuvion määritelmät: ks. 1. harjoitukset.

Sovellettu todennäköisyyslaskenta B

GeoGebra tutkivan oppimisen välineenä: havainto-hypoteesi-testaus

Tilaston esittäminen frekvenssitaulukossa ja graafisesti. Keskiluvut luokittelemattomalle ja luokitellulle aineistolle: moodi, mediaani, keskiarvo.

Esimerkki 1: auringonkukan kasvun kuvailu

Harjoitus 7: NCSS - Tilastollinen analyysi

KAHDEN RYHMÄN VERTAILU

Testejä suhdeasteikollisille muuttujille

Sovellettu todennäköisyyslaskenta B

Tilastollisen analyysin perusteet Luento 5: Jakaumaoletuksien. testaaminen

Luottamusvälit. Normaalijakauma johnkin kohtaan

Todennäköisyyden ominaisuuksia

edellyttää valintaa takaisinpanolla Aritmeettinen keskiarvo Jos, ½ Ò muodostavat satunnaisotoksen :n jakaumasta niin Otosvarianssi Ë ¾

... Vinkkejä lopputyön raportin laadintaan. Sisältö 1. Johdanto 2. Analyyseissä käytetyt muuttujat 3. Tulososa 4. Reflektio (korvaa Johtopäätökset)

Jos nollahypoteesi pitää paikkansa on F-testisuuren jakautunut Fisherin F-jakauman mukaan

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi. Viikko 5

b) Jos Ville kaataisikin karkit samaan pussiin ja valitsisi sieltä sattumanvaraisen karkin, niin millä todennäköisyydellä hän saisi merkkarin?

7.4 Normaalijakauma (kertausta ja täydennystä) Taulukosta P(Z 1,6449) = 0,05, P(Z -1,6449) = 0,05 P(Z 1,96) = 0,025, P(Z -1,96) = 0,025

10. laskuharjoituskierros, vko 14, ratkaisut

Tilastollisten aineistojen kuvaaminen

Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Johdatus tilastotieteeseen Tilastollisten aineistojen kuvaaminen. TKK (c) Ilkka Mellin (2005) 1

Otoskeskiarvo on otossuure, jonka todennäköisyysjakauma tiedetään. Se on normaalijakauma, havainnollistaminen simuloiden

031021P Tilastomatematiikka (5 op) viikko 5

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

Transkriptio:

Lisätehtäviä (siis vanhoja tenttikysymyksiä) 1. Erään yrityksen satunnaisesti valittujen työntekijöiden poissaolopäivien määrät olivat vuonna 003: 5, 3, 16, 9, 0, 1, 3,, 19, 5, 19, 11,, 0, 4, 6, 1, 15, 4, 0,, 4, 3, 3, 8, 3, 9, 11, 19, 17, 14, 7 a) Luokittele havainnot tasavälisesti siten, että luokkavälin pituus on 4. Esitä poissaolopäivien frekvenssijakauma taulukkona. b) Muodosta jakaumasta sellainen tilastokuvio, jonka perusteella voit arvioida mediaanin. Mikä on mediaaniarvo? Kuvaile myös lyhyesti arviointitapaasi. c) Laske jakauman aritmeettinen keskiarvo, keskihajonta ja variaatiokerroin.. Sanomalehtipaperin neliömetripainoja tutkittaessa saatiin painon frekvenssijakaumaksi eräässä otoksessa seuraava: paino (g/m ) lukumäärä 4.0 4.9 4 43.0 43.9 7 a) Määritä painojakauman mediaani 44.0 44.9 15 ja kvartiiliväli esim. sopivan kuvion 45.0 45.9 16 avulla. 46.0 46.9 7 b) Määritä painojakauman keskiarvo 47.0 47.9 10 ja keskihajonta. 48.0 48.9 1 c) Kuvaile määrittämiesi tunnuslukujen avulla jakauman muotoa. 3. Metsäntutkimuslaitoksen koealalta mitattiin koivujen läpimittaa (rinnankorkeudelta) ja huomattiin sen olevan normaalijakautunut odotusarvolla 0.5 cm ja varianssina 6.5 cm. a) Kuinka monta prosenttia koivuista on läpimitaltaan ainakin 18 cm? b) Määritä rinnankorkeusläpimitan yläkvartiili. 4. Seuraavaan ristiintaulukkoon on kerätty tehtaassa valmistettujen toimivien ja ei-toimivien leikkijunien lukumäärät eri työvuoroissa: Leikkijunan kunto toimiva ei-toimiva Työvuoro aamuvuoro 473 30 päivävuoro 560 6 iltavuoro 37 30 Laske sellaisen tilastollisen riippuvuustunnusluvun arvo, jonka perusteella voit päätellä, onko työvuorolla ja leikkijunan kunnolla yhteyttä. Mitkä ovat johtopäätöksesi? 5. Kuluttajavirasto on jälleen joulun alla testannut lelujen turvallisuutta. Tutkimukseen valittiin myymälöistä sattumanvaraisesti 101 leikkikalua. Testatuista leluista 69 täytti turvallisuusvaatimukset (Lähde: YLEn uutiset, 9.1.004). Muodosta sellainen 95 %:n luottamusväli, jonka avulla voit arvioida, kuinka monta prosenttia kaikista myytävistä leikkikaluista on turvallisuusvaatimukset täyttäviä.

6. Oheisessa taulukossa on esitetty kolmen kulutusmuuttujan tilastollisia tunnuslukuja vuodelta 000. Havaintoaineiston tilastoyksiköt ovat Euroopan maita (Lähde: Tilastokeskus, Maailma numeroina.) Tulkitse tuloksia ja vastaa seuraaviin kysymyksiin. Statistics N = havaintojen määrä Mean = keskiarv o Median = mediaani Mode = moodi Std. Dev iation = keskihajonta Variance = v arianssi Skewness = v inous Kurt osis = huipukkuus Minimum = pienin arvo Maximum = suurin arvo Percentiles = f raktiilit 5 50 75 a. Multiple modes exist. The smallest value is shown Viinin kulutus l/henk. Oluen kulutus l/henk. Väkev ien kulutus l/henk. 7 7 7 3,333 67,111,81 0,000 59,600 1,900 7,9 3,5 a,4 15,5075 39,6603 1,4754 40,4838 157,9356,1770,48,70 1,175 -,58,37,610 1,0 3,5,5 56,0 160,0 5,6 9,700 37,100 1,00 0,000 59,600 1,900 33,00 95,400,800 = Moodeja on useita. Niistä esitetään pienin. a) Onko muuttujan Oluen kulutus jakauma normaalijakauma? Perustele vastauksesi. b) Mikä keskiluku sopii nyt kuvaamaan muuttujan Oluen kulutus jakauman keskikohtaa? Perustele vastauksesi. c) Onko muuttujan Viinin kulutus jakauma symmetrinen? Perustele vastauksesi. d) Mikä on muuttujan Väkevien kulutus kvartiilivälin pituus? e) Millä muuttujalla on absoluuttisesti pienin hajonta? Perustele vastauksesi. f) Millä muuttujalla on suhteellisesti suurin hajonta? Perustele vastauksesi. 7. Tietyllä alueella suoritettiin kallioperän nikkelipitoisuuden selvitystyötä. Alueelta valittiin 5 kivinäytettä, joiden nikkelipitoisuuden keskiarvo oli 10. % ja keskihajonta 3.1 %. a) Määritä ko. alueen keskimääräiselle nikkelipitoisuudelle 95 %:n luottamusväli. b) Määritä ko. alueen keskimääräisen nikkelipitoisuuden 99 %:n luottamusväli, kun valittuja kivinäytteitä olisi ollutkin 40 kpl (keskiarvo ja keskihajonta pysyvät samoina). 8. Winnfear Oy:n johtaja on kiinnostunut siitä, onko uimapukujen myynnillä (y) ja kesäkuun päivien keskilämpötilalla (x) yhteyttä. Vuosien varrelta on saatu seuraavia tietoja: x 19 3 5 4 6 1 y 660 740 70 760 780 70 Laske Pearsonin korrelaation arvo. (Avuksi x 138, x 308, y 4380, y 306000, x y 10100 ) i i i i 9. Itikoita inisee juhannuskokon ympärillä. Aikaisempien juhannuskokemusten perusteella tiedät, että todennäköisyys sille, että saat tapetuksia yhden itikan on 0.4. Kokon ympärillä inisee 100 itikkaa. Millä todennäköisyydellä saat tapettua niistä ainakin 35? (Voit arvioida sopivalla jakaumalla.) i i

10. Yritys ilmoitti valmistavansa kasvisrasvan markkinaosuudeksi 13.6 %. Kilpailija tutki väitettä poimimalla eri puolilta maata 1 myymälän otoksen, jossa ko. rasvan keskimääräinen markkinaosuus oli 1..% ja markkinaosuuksien keskihajonta 3.6 %. Testaa merkitsevyystasolla 0.05, onko valmistajan ilmoitus oikea. 11. Eräässä isossa populaatiossa 40 % on naisia. Valitaan tästä populaatiosta 4 henkilön otos. Mikä on otoksessa olevien naisten lukumäärän todennäköisyysjakauma? Millä todennäköisyydellä otokseen tuli ainakin kolme naista? 1. Olkoon kahdessa toisistaan riippumattomassa tilastollisessa testissä kummassakin todennäköisyys I lajin virheelle 0.05. Millä todennäköisyydellä ainakin toisessa testissä tehdään I lajin virhe? Vastauksia Tehtävä 1. a) Luokkavälin pituus 4, joten luokkia viisi: päivien lkm työntekijälkm 0 3 1 4 7 7 8 11 5 1 15 3 16 19 5 Yhteensä 3 b) useita vaihtoehtoja, esim. frekvenssihistogrammi, summakäyrä tai runkolehtikuvio ja mediaani n. 5 (kuviosta riippuen arvio voi olla hiukan isompikin) c) x = 7.39 ja s = 6.11 ja V = 0.88 Tehtävä. a) Esim. summakäyrästä katsottuna Md noin 45. ja kvartiiliväli noin (44.3, 46.4) b) m i f i m i f i m i 4.45 169.8 708.01 43.45 304.15 1315.3175 44.45 666.75 9637.0375 45.45 77. 33051.4 46.45 35.15 15103.175 47.45 474.5 515.05 48.45 48.45 347.405 716 13077.5 x = 45.3 ja s = 1.5 c) Koska keskiarvo ja mediaani ovat lähes samat, on jakauma melko symmetrinen. Koska kvartiiliväli on melko kapea, on muuttuja-arvojen keskittyminen melko voimakasta.

Tehtävä 3. a) P(x > 18) = 1- P(x < 18) = 1- ( 18 0.5 ) = 1- [ 1-0.8413 ; 84% 6.5 b) Standardoidun normaalijakauman yläkvartiili (eli 75 %:n fraktiili) on 0.67, koska (0.67) 0.75. Kun satunnaismuuttujan x yläkvartiili Q 3 standardoidaan: Q 3 0.5 täytyy sen vastata luku 0.67 eli saadaan 6.5 yhtälö Q 3 0.5 = 0.67, josta Q 3 =.175 6.5 Tehtävä 4. Riippuvuuslukuna voidaan käyttää kontingenssikerrointa. Seuraavassa taulukossa on esitetty teoreettiset eli odotetut frekvenssit Leikkijunan kunto toimiva ei-toimiva Yhteensä Työvuoro aamuvuoro 473 30 503 päivävuoro 551 35 586 iltavuoro 336 1 357 Yhteensä 1360 86 1446 C 473 473 30 30 560 551 6 35 37 336 30 1 473 6.6 6.6 1446 0.07 30 551 35 336 1 6.6 Kontingenssikertoimen arvo niin lähellä lukua 0, että kunnolla ja työvuorolla ei ole yhteyttä. Tehtävä 5. n = 101 Otoksessa turvallisia leluja oli P = 69 100 = 68.3 %; = 0.05, z = 1.96 101 0.05 95 %:n luottamusväli turvallisten lelujen prosenttiosuudelle on (59., 77.4) Tehtävä 6. a) ei ole, koska jakauma ei ole symmetrinen, vaan oikealle loiveneva eli positiivisesti vino (vinous > 0.5) b) mediaaniarvo 59.6 (koska jakauma ei ole symmetrinen) c) kohtalaisen symmetrinen, koska vinous välillä (-0.5, 0.5) d) kvartiilivälin pituus =.8 1. = 1.6 e) keskihajonta mittaa absoluuttista hajaantumista, ja pienin keskihajonta on väkevien kulutuksella f) suhteellista hajaantumista mittaa variaatiokerroin ( keskihajonnan ja keskiarvon suhde) ja suurin variaatiokerroin (0.665) on viinin kulutuksella

Tehtävä 7. Sekä a) että b) kohdissa ei tunneta populaatiovarianssia, joten luottamusväli populaation keskiarvolle määritetään sen esityksen avulla, missä käytetään t-jakaumaa. a) n = 5, x = 10. ja s = 3.1; = 0.05, t 0.05 (5-1) =.064 95 %:n luottamusväli koko alueen keskimääräiselle nikkelipitoisuudelle on siten (10..064 3.1, 10. +.064 3.1 ) = (8.9, 11.5) 5 5 b) n = 40, x = 10. ja s = 3.1; = 0.01, t 0.005 (40-1) t 0.005 (40) =.704 99 %:n luottamusväli koko alueen keskimääräiselle nikkelipitoisuudelle on siten (10..704 3.1, 10. +.704 3.1 ) = (8.9, 11.5) 40 40 Tehtävä 8. 1384380 10100 r 6 138 4380 308 306000 6 6 = 0.851 Keskilämpötilan ja uimapukujen myynnin välillä on positiivista lineaarista riippuvuutta, ja sehän tarkoittaa, että mitä lämpimämpi kesäkuu on ollut, sitä enemmän on uimapukujakin myyty. Tehtävä 9. x = tapettujen itikoiden lkm, jakaumana Bin(100, 0.4) mutta likimain jakaumana N(40, 4) P(x > 35) = 1- P(x < 35)= 1- ( 35 40 ) 0.85 4 Tehtävä 10. Yhden otoksen keskiarvotesti, populaatiovarianssi tuntematon n = 1, x = 1., s= 3.6 Hypoteesit: H 0 : = 13.6 H 1 : 13.6 = 0.05, t 0.05 (1-1) =.01 ja kriittinen alue C ={ t t >.01} t = 1. 13.6 3.6 / 1 = -1.34 Testisuureen arvo ei ole kriittisellä alueella, joten nollahypoteesi hyväksytään. Valmistajan ilmoitus näyttää oikealta.

Tehtävä 11. x = naisten lukumäärä neljän henkilön satunnaisotoksessa ~ Bin(4, 0.4) P(tuli ainakin kolme naista) = P(x 3) = P(x = 3) + P(x = 4) = Tehtävä 1. P(A testissä 1. lajin virhe) = 0.05 ja P(B testissä 1. lajin virhe) = 0.05 P( ainakin toisessa 1. lajin virhe) = 1- P(1. lajin virhettä ei lainkaan) = 1 P(A testissä ei 1. lajin virhettä) P(B testissä ei 1. lajin virhettä) = 1-0.95 0.95 = 0.0975