Leikkijunan kunto toimiva ei-toimiva Työvuoro aamuvuoro päivävuoro iltavuoro

Samankaltaiset tiedostot
4. Seuraavaan ristiintaulukkoon on kerätty tehtaassa valmistettujen toimivien ja ei-toimivien leikkijunien lukumäärät eri työvuoroissa:

3. a) Mitkä ovat tilastolliset mitta-asteikot? b) Millä tavalla nominaaliasteikollisen muuttujan jakauman voi esittää?

1.Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet

KURSSIKYSELYAINEISTO: HUOM! Aineiston tilastoyksikkömäärä 11 on kovin pieni oikean tilastotieteen tekemiseen, mutta Harjoitteluun se kelpaa kyllä!

1. Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet

Til.yks. x y z

pisteet Frekvenssi frekvenssi Yhteensä

Ennen seuraavia tehtäviä tarkista, että KUNNAT-aineistossasi on 12 muuttujaa ja 416 tilastoyksikköä.

c) A = pariton, B = ainakin 4. Nyt = silmäluku on5 Koska esim. P( P(A) P(B) =, eivät tapahtumat A ja B ole riippumattomia.

Sovellettu todennäköisyyslaskenta B

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170

Esim. Pulssi-muuttujan frekvenssijakauma, aineisto luentomoniste liite 4

Ennen seuraavia tehtäviä tarkista, että KUNNAT-aineistossasi on 12 muuttujaa ja 416 tilastoyksikköä.

806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy (1 α) = 99 1 α = 0.

Kvantitatiiviset tutkimusmenetelmät maantieteessä

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen., jos otoskeskiarvo on suurempi kuin 13,96. Mikä on testissä käytetty α:n arvo?

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

Tilastollinen aineisto Luottamusväli

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 6. luento. Pertti Palo

HAVAITUT JA ODOTETUT FREKVENSSIT

Mat Tilastollisen analyysin perusteet. Tilastollisten aineistojen kerääminen ja mittaaminen Tilastollisten aineistojen kuvaaminen Väliestimointi

Tilastotieteen kertaus. Kuusinen/Heliövaara 1

A130A0650-K Tilastollisen tutkimuksen perusteet 6 op Tentti / Anssi Tarkiainen & Maija Hujala

Tutkimusongelmia ja tilastollisia hypoteeseja: Perunalastupussien keskimääräinen paino? Nollahypoteesi Vaihtoehtoinen hypoteesi (yksisuuntainen)

Harjoittele tulkintoja

Til.yks. x y z

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

Estimointi. Vilkkumaa / Kuusinen 1

tilastotieteen kertaus

Sovellettu todennäköisyyslaskenta B

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

Väliestimointi (jatkoa) Heliövaara 1

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

riippumattomia ja noudattavat samaa jakaumaa.

/1. MTTTP5, luento Normaalijakauma (jatkuu) Binomijakaumaa voidaan approksimoida normaalijakaumalla

SISÄLTÖ 1 TILASTOJEN KÄYTTÖ...7 MITÄ TILASTOTIEDE ON?

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu

1 TILASTOJEN KÄYTTÖ 7. Mitä tilastotiede on 7 Historiaa 8 Tilastotieteen nykyinen asema 9 Tilastollisen tutkimuksen vaiheet 10

Tulkitse tulokset. Onko muuttujien välillä riippuvuutta? Jos riippuvuutta on, niin millaista se on?

Sovellettu todennäköisyyslaskenta B

Näistä standardoiduista arvoista laskettu keskiarvo on nolla ja varianssi 1, näin on standardoidulle muuttujalle aina.

Valitaan testisuure, jonka jakauma tunnetaan H 0 :n ollessa tosi.

MTTTP5, luento Otossuureita ja niiden jakaumia (jatkuu)

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

/1. MTTTP5, luento Normaalijakauma (jatkuu) Binomijakaumaa voidaan approksimoida normaalijakaumalla

Luottamusvälit. Normaalijakauma johnkin kohtaan

Esimerkki 1: auringonkukan kasvun kuvailu

Lisätehtäviä ratkaisuineen luentomonisteen lukuihin 2-4 liittyen

POPULAATIO. Oikeastaan arvot, joista ollaan kiinnostuneita (mitatut numeeriset suureet, luokittelut).

54. Tehdään yhden selittäjän lineaarinen regressioanalyysi, kun selittäjänä on määrällinen muuttuja (ja selitettävä myös):

Kandidaatintutkielman aineistonhankinta ja analyysi

edellyttää valintaa takaisinpanolla Aritmeettinen keskiarvo Jos, ½ Ò muodostavat satunnaisotoksen :n jakaumasta niin Otosvarianssi Ë ¾

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

MTTTP1, luento KERTAUSTA

Luento KERTAUSTA Kaksiulotteinen jakauma Pisteparvi, Toyota Avensis -farmariautoja

Näistä standardoiduista arvoista laskettu keskiarvo on nolla ja varianssi 1, näin on standardoidulle muuttujalle aina.

10. laskuharjoituskierros, vko 14, ratkaisut

dx=5&uilang=fi&lang=fi&lvv=2014

Regressioanalyysi. Vilkkumaa / Kuusinen 1

GeoGebra tutkivan oppimisen välineenä: havainto-hypoteesi-testaus

Estimointi populaation tuntemattoman parametrin arviointia otossuureen avulla Otossuure satunnaisotoksen avulla määritelty funktio

Korrelaatiokerroin. Hanna Heikkinen. Matemaattisten tieteiden laitos. 23. toukokuuta 2012

¼ ¼ joten tulokset ovat muuttuneet ja nimenomaan huontontuneet eivätkä tulleet paremmiksi.

Otoskoko 107 kpl. a) 27 b) 2654

/1. MTTTP1, luento Normaalijakauma (jatkoa) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti:

1. Tilastollinen malli??

/1. MTTTP5, luento Kertausta. Olk. X 1, X 2,..., X n on satunnaisotos N(µ, ):sta, missä tunnettu. Jos H 0 on tosi, niin

r = n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit.

Sovellettu todennäköisyyslaskenta B

/1. MTTTP1, luento Normaalijakauma (kertausta) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti:

Kuvioita, taulukoita ja tunnuslukuja. Aki Taanila

Kaavakokoelma, testikaaviot ja jakaumataulukot liitteinä. Ei omia taulukoita! Laskin sallittu.

Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Testit laatueroasteikollisille muuttujille

Kynä-paperi -harjoitukset. Taina Lehtinen Taina I Lehtinen Helsingin yliopisto

MTTTP5, luento Luottamusväli, määritelmä

Todennäköisyyden ominaisuuksia

Testejä suhdeasteikollisille muuttujille

Tavanomaisten otostunnuslukujen, odotusarvon luottamusvälin ja Box ja Whisker -kuvion määritelmät: ks. 1. harjoitukset.

Jos nyt on saatu havaintoarvot Ü ½ Ü Ò niin suurimman uskottavuuden

ABHELSINKI UNIVERSITY OF TECHNOLOGY

Ohjeita kvantitatiiviseen tutkimukseen

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1

MTTTP1, luento KERTAUSTA

Sovellettu todennäköisyyslaskenta B

Otoskeskiarvo on otossuure, jonka todennäköisyysjakauma tiedetään. Se on normaalijakauma, havainnollistaminen simuloiden

Miten voidaan arvioida virheellisten komponenttien osuutta tuotannossa? Miten voidaan arvioida valmistajan kynttilöiden keskimääräistä palamisaikaa?

Harjoitus 7: NCSS - Tilastollinen analyysi

Osa 2: Otokset, otosjakaumat ja estimointi

b) Jos Ville kaataisikin karkit samaan pussiin ja valitsisi sieltä sattumanvaraisen karkin, niin millä todennäköisyydellä hän saisi merkkarin?

b6) samaan perusjoukkoon kohdistuu samanaikaisesti useampia tutkimuksia.

Tilastollisten aineistojen kuvaaminen

Mat Tilastollisen analyysin perusteet, kevät 2007

Johdatus tilastotieteeseen Tilastollisten aineistojen kuvaaminen. TKK (c) Ilkka Mellin (2005) 1

Transkriptio:

Lisätehtäviä 1. Erään yrityksen satunnaisesti valittujen työntekijöiden poissaolopäivien määrät olivat vuonna 003: 5, 3, 16, 9, 0, 1, 3,, 19, 5, 19, 11,, 0, 4, 6, 1, 15, 4, 0,, 4, 3, 3, 8, 3, 9, 11, 19, 17, 14, 7 a) Luokittele havainnot tasavälisesti siten, että luokkavälin pituus on 4. Esitä poissaolopäivien frekvenssijakauma taulukkona. b) Muodosta jakaumasta sellainen tilastokuvio, jonka perusteella voit arvioida mediaanin. Mikä on mediaaniarvo? Kuvaile myös lyhyesti arviointitapaasi. c) Laske jakauman aritmeettinen keskiarvo, keskihajonta ja variaatiokerroin.. Sanomalehtipaperin neliömetripainoja tutkittaessa saatiin painon frekvenssijakaumaksi eräässä otoksessa seuraava: paino (g/m ) lukumäärä 4.0 4.9 4 43.0 43.9 7 a) Määritä painojakauman mediaani 44.0 44.9 15 ja kvartiiliväli. 45.0 45.9 16 b) Määritä painojakauman keskiarvo 46.0 46.9 7 ja keskihajonta. 47.0 47.9 10 c) Kuvaile määrittämiesi tunnus- 48.0 48.9 1 lukujen avulla jakauman muotoa. 3. Metsäntutkimuslaitoksen koealalta mitattiin koivujen läpimittaa (rinnankorkeudelta) ja huomattiin sen olevan normaalijakautunut odotusarvolla 0.5 cm ja varianssina 6.5 cm. a) Kuinka monta prosenttia koivuista on läpimitaltaan ainakin 18 cm? b) Määritä rinnankorkeusläpimitan yläkvartiili. 4. Seuraavaan ristiintaulukkoon on kerätty tehtaassa valmistettujen toimivien ja ei-toimivien leikkijunien lukumäärät eri työvuoroissa: Leikkijunan kunto toimiva ei-toimiva Työvuoro aamuvuoro 473 30 päivävuoro 560 6 iltavuoro 37 30 Laske sellaisen tilastollisen riippuvuustunnusluvun arvo, jonka perusteella voit päätellä, onko työvuorolla ja leikkijunan kunnolla yhteyttä. Mitkä ovat johtopäätöksesi? 5. Kuluttajavirasto on jälleen joulun alla testannut lelujen turvallisuutta. Tutkimukseen valittiin myymälöistä sattumanvaraisesti 101 leikkikalua. Testatuista leluista 69 täytti turvallisuusvaatimukset (Lähde: YLEn uutiset, 9.1.004). Muodosta sellainen 95 %:n luottamusväli, jonka avulla voit arvioida, kuinka monta prosenttia kaikista myytävistä leikkikaluista on turvallisuusvaatimukset täyttäviä. 6. Haluttiin tutkia, parantaako uusi tuotantomenetelmä tuotteen laatua. Vanhan tuotantomenetelmän tuotteista poimittiin 5 alkion otos, josta saatiin laatumittauksen keskiarvoksi 10 ja keskihajonnaksi 15. Uuden tuotantomenetelmän tuotteista poimittiin 17 alkion otos, josta saatiin keskiarvoksi 15 ja keskihajonnaksi 18. Oletetaan, että molemmissa populaatioissa varianssit ovat samat.

Testaa merkitsevyystasolla 0.05, voidaanko otoksien perusteella sanoa, että uudella menetelmällä saadaan keskimäärin parempilaatuisia tuotteita. 7. Oheisessa taulukossa on esitetty kolmen kulutusmuuttujan tilastollisia tunnuslukuja vuodelta 000. Havaintoaineiston tilastoyksiköt ovat Euroopan maita (Lähde: Tilastokeskus, Maailma numeroina.) Tulkitse tuloksia ja vastaa seuraaviin kysymyksiin. Statistics N = havaintojen määrä Mean = keskiarvo Median = mediaani Mode = moodi Std. Deviation = keskihajonta Variance = varianssi Skewness = vinous Kurtosis = huipukkuus Minimum = pienin arvo Maximum = suurin arvo Percentiles = fraktiilit 5 50 75 a. Multiple modes exist. The smallest value is shown Viinin kulutus l/henk. Oluen kulutus l/henk. Väkevien kulutus l/henk. 7 7 7 3,333 67,111,81 0,000 59,600 1,900 7,9 3,5 a,4 15,5075 39,6603 1,4754 40,4838 157,9356,1770,48,70 1,175 -,58,37,610 1,0 3,5,5 56,0 160,0 5,6 9,700 37,100 1,00 0,000 59,600 1,900 33,00 95,400,800 = Moodeja on useita. Niistä esitetään pienin. a) Onko muuttujan Oluen kulutus jakauma normaalijakauma? Perustele vastauksesi. b) Mikä keskiluku sopii nyt kuvaamaan muuttujan Oluen kulutus jakauman keskikohtaa? Perustele vastauksesi. c) Onko muuttujan Viinin kulutus jakauma symmetrinen? Perustele vastauksesi. d) Mikä on muuttujan Väkevien kulutus kvartiilivälin pituus? e) Millä muuttujalla on absoluuttisesti pienin hajonta? Perustele vastauksesi. f) Millä muuttujalla on suhteellisesti suurin hajonta? Perustele vastauksesi. 8. Tietyllä alueella suoritettiin kallioperän nikkelipitoisuuden selvitystyötä. Alueelta valittiin 5 kivinäytettä, joiden nikkelipitoisuuden keskiarvo oli 10. % ja keskihajonta 3.1 %. a) Määritä ko. alueen keskimääräiselle nikkelipitoisuudelle 95 %:n luottamusväli. b) Määritä ko. alueen keskimääräisen nikkelipitoisuuden 99 %:n luottamusväli, kun valittuja kivinäytteitä olisi ollutkin 40 kpl (keskiarvo ja keskihajonta pysyvät samoina). 9. Winnfear Oy:n johtaja on kiinnostunut siitä, onko uimapukujen myynnillä (y) ja kesäkuun päivien keskilämpötilalla (x) yhteyttä. Vuosien varrelta on saatu seuraavia tietoja: x 19 3 5 4 6 1 y 660 740 70 760 780 70 Laske Pearsonin korrelaation arvo. (Avuksi x 138, x 308, y 4380, y 306000, x y 10100 ) i i i i i i

10. Itikoita inisee juhannuskokon ympärillä. Aikaisempien juhannuskokemusten perusteella tiedät, että todennäköisyys sille, että saat tapetuksia yhden itikan on 0.4. Kokon ympärillä inisee 100 itikkaa. Millä todennäköisyydellä saat tapettua niistä ainakin 35? (Voit arvioida sopivalla jakaumalla.) 11. Yritys ilmoitti valmistavansa kasvisrasvan markkinaosuudeksi 13.6 %. Kilpailija tutki väitettä poimimalla eri puolilta maata 1 myymälän otoksen, jossa ko. rasvan keskimääräinen markkinaosuus oli 1..% ja markkinaosuuksien keskihajonta 3.6 %. Testaa merkitsevyystasolla 0.05, onko valmistajan ilmoitus oikea, kun oletetaan, että markkinaosuuden jakauma on normaalijakauma. 1. Suuren kauppaketjun johto suunnittelee laajentamista uusia myymälöitä avaamalla. Tätä varten se tarvitsee arvion myymälän pinta-alan (1000 m ) ja myynnin (milj. ) välisestä yhteydestä. Yhdentoista jo toimivan myymälän satunnaisotos tuotti seuraavan aineiston asian selvittämiseksi. Pinta-ala 1.7 1.6.8 5.6 1.3. 1.3 1.1 3. 1.5 5. Myynti 3.7 3.9 6.7 9.5 3.4 5.6 3.7.7 5.5.9 10.7 a) Esitä aineisto tilastokuviona siten. että siitä selviää myynnin riippuvuus pinta-alasta. Luonnehdi riippuvuutta sanallisesti. b) Sovita kuvioon silmämäärin sellainen lineaarinen regressiomalli, jossa pinta-ala on selittävä muuttuja. c) Määritä regressiomallin kertoimet laskemalla. Voit käyttää hyväksesi seuraavia tunnuslukuja: pinta-alan keskiarvo on.5 ja keskihajonta 1.58, myynnin keskiarvo on 5.3 ja keskihajonta.69, sekä pinta-alan ja myynnin välinen kovarianssi 4.085. Vastauksia Tehtävä 1. a) Luokkavälin pituus 4, joten luokkia viisi: päivien lkm työntekijälkm 0 3 1 4 7 7 8 11 5 1 15 3 16 19 5 Yhteensä 3 b) useita vaihtoehtoja, esim. frekvenssihistogramma, summakäyrä tai runkolehtikuvio ja mediaani n. 5 (kuviosta riippuen arvio voi olla hiukan isompikin) c) x = 7.39 ja s = 6.11 ja V = 0.88 Tehtävä. a) Esim. summakäyrästä katsottuna Md noin 45. ja kvartiiliväli noin (44.3, 46.4) b) m i f i m i f i m i 4.45 169.8 708.01 43.45 304.15 1315.3175 44.45 666.75 9637.0375 45.45 77. 33051.4 46.45 35.15 15103.175

47.45 474.5 515.05 48.45 48.45 347.405 716 13077.5 x = 45.3 ja s = 1.5 c) Koska keskiarvo ja mediaani ovat lähes samat, on jakauma melko symmetrinen. Koska kvartiiliväli on melko kapea, on muuttuja-arvojen keskittyminen melko voimakasta. Tehtävä 3. a) P(x > 18) = 1- P(x < 18) = 1- ( 18 0.5 ) = 1- [ 1-0.8413 ; 84% 6.5 b) Standardoidun normaalijakauman alakvartiili on 0.67, koska (0.67) 0.75. Kun satunnaismuuttujan x yläkvartiili Q 3 standardoidaan: Q 3 0.5 täytyy sen vastata luku 0.67 eli saadaan yhtälö 6.5 Q 3 0.5 = 0.67, josta Q 3 =.175 6.5 Tehtävä 4. Riippuvuuslukuna voidaan käyttää kontingenssikerrointa. Seuraavassa taulukossa on teoreettiset frekvenssit Leikkijunan kunto toimiva ei-toimiva Yhteensä Työvuoro aamuvuoro 473 30 503 päivävuoro 551 35 586 iltavuoro 336 1 357 Yhteensä 1360 86 1446 C 473 473 30 30 560 551 6 35 37 336 30 1 473 6.6 6.6 1446 0.07 30 551 35 336 1 6.6 Kontingenssikertoimen arvo niin lähellä lukua 0, että kunnolla ja työvuorolla ei ole yhteyttä. Tehtävä 5. n = 101 Otoksessa turvallisia leluja oli P = 69 100 = 68.3 %; = 0.05, z = 1.96 101 0.05 95 %:n luottamusväli turvallisten lelujen prosenttiosuudelle on (59., 77.4)

Tehtävä 6. Vanha Uusi n 1 = 5 n = 17 x 1 = 10 x = 15 s 1 = 15 s = 18 Käytetään kahden riippumattoman otoksen keskiarvotesteistä sitä t-versiota, jossa populaatioiden varianssit 1 ja oletetaan yhtäsuuriksi eli 1 = = Hypoteesit: H 0 : 1 = H 1 : 1 < Määritetään populaatioiden yhteisen varianssin estimaatti: s = (5 1) 15 (17 1) 18 5 17 = 64.6, joten yhteisen keskihajonnan estimaatti on s = 16.66 = 0.05; t 0.05 (5 + 17 - ) = t 0.05 (40) = 1.684 ja kriittinen alue C = {t t < -1.684} 10 15 t = = -0.98 ei ole kriittisellä alueella, 1 1 16.66 5 17 joten vanha ja uusi menetelmä keskimäärin samanlaisia laadultaan Tehtävä 7. a) ei ole, koska jakauma ei ole symmetrinen, vaan oikealle loiveneva eli positiivisesti vino (vinous > 0.5) b) mediaaniarvo 59.6 (koska jakauma ei ole symmetrinen) c) kohtalaisen symmetrinen, koska vinous välillä (-0.5, 0.5) d) kvartiilivälin pituus =.8 1. = 1.6 e) keskihajonta mittaa absoluuttista hajaantumista, ja pienin keskihajonta on väkevien kulutuksella f) suhteellista hajaantumista mittaa variaatiokerroin ( keskihajonnan ja keskiarvon suhde) ja suurin variaatiokerroin (0.665) on viinin kulutuksella Tehtävä 8. Sekä a) että b) kohdissa ei tunneta populaatiovarianssia, joten luottamusväli populaation keskiarvolle määritetään sen esityksen avulla, missä käytetään t-jakaumaa. a) n = 5, x = 10. ja s = 3.1; = 0.05, t 0.05 (5-1) =.064 95 %:n luottamusväli koko alueen keskimääräiselle nikkelipitoisuudelle on siten (10..064 3.1, 10. +.064 3.1 ) = (8.9, 11.5) 5 5 b) n = 40, x = 10. ja s = 3.1; = 0.01, t 0.005 (40-1) t 0.005 (40) =.704 99 %:n luottamusväli koko alueen keskimääräiselle nikkelipitoisuudelle on siten (10..704 3.1, 10. +.704 3.1 ) = (8.9, 11.5) 40 40

Tehtävä 9. 1384380 10100 r 6 138 4380 308 306000 6 6 = 0.851 Keskilämpötilan ja uimapukujen myynnin välillä on positiivista lineaarista riippuvuutta, ja sehän tarkoittaa, että mitä lämpimämpi kesäkuu on ollut, sitä enemmän on uimapukujakin myyty. Tehtävä 10. x = tapettujen itikoiden lkm, jakaumana Bin(100, 0.4) Mutta likimain jakaumana N(40, 4) P(x > 35) = 1- P(x < 35)= 1- ( 35 40 ) 0.85 4 Tehtävä 11. Yhden otoksen keskiarvotesti, populaatiovarianssi tuntematon n = 1, x = 1., s= 3.6 Hypoteesit: H 0 : = 13.6 H 1 : 13.6 = 0.05, t 0.05 (1-1) =.01 ja kriittinen alue C ={ t t >.01} t = 1. 13.6 3.6 / 1 = -1.34 Testisuureen arvo ei ole kriittisellä alueella, joten nollahypoteesi hyväksytään. Valmistajan ilmoitus näyttää oikealta. Tehtävä 1. a) ja b) c) ; Malli: ŷ 1.11.634 x