Seuraavassa muutamia lisätehtäviä 1. Erään yrityksen satunnaisesti valittujen työntekijöiden poissaolopäivien määrät olivat vuonna 003: 5, 3, 16, 9, 0, 1, 3,, 19, 5, 19, 11,, 0, 4, 6, 1, 15, 4, 0,, 4, 3, 3, 8, 3, 9, 11, 19, 17, 14, 7 a) Luokittele havainnot tasavälisesti siten, että luokkavälin pituus on 4. Esitä poissaolopäivien frekvenssijakauma taulukkona. b) Muodosta jakaumasta sellainen tilastokuvio, jonka perusteella voit arvioida mediaanin. Mikä on mediaaniarvo? Kuvaile myös lyhyesti arviointitapaasi. c) Laske jakauman aritmeettinen keskiarvo, keskihajonta ja variaatiokerroin käyttäen alkuperäisiä havaintoja. Sanomalehtipaperin neliömetripainoja tutkittaessa saatiin painon frekvenssijakaumaksi eräässä otoksessa seuraava: paino (g/m ) lukumäärä 4.0 4.9 4 43.0 43.9 7 a) Määritä painojakauman mediaani 44.0 44.9 15 ja kvartiiliväli. 45.0 45.9 16 b) Määritä painojakauman keskiarvo 46.0 46.9 7 ja keskihajonta. 47.0 47.9 10 c) Kuvaile määrittämiesi tunnus- 48.0 48.9 1 lukujen avulla jakauman muotoa. 3. a) Mitkä ovat tilastolliset mitta-asteikot? b) Millä tavalla nominaaliasteikollisen muuttujan jakauman voi esittää? 4. Metsäntutkimuslaitoksen koealalta mitattiin koivujen läpimittaa (rinnankorkeudelta) ja huomattiin sen olevan normaalijakautunut odotusarvolla 0.5 cm ja varianssina 6.5 cm. a) Kuinka monta prosenttia koivuista on läpimitaltaan ainakin 18 cm? b) Määritä rinnankorkeusläpimitan yläkvartiili. 5. Seuraavaan ristiintaulukkoon on kerätty tehtaassa valmistettujen toimivien ja ei-toimivien leikkijunien lukumäärät eri työvuoroissa: Leikkijunan kunto toimiva ei-toimiva Työvuoro aamuvuoro 473 30 päivävuoro 560 6 iltavuoro 37 30 Laske sellaisen tilastollisen riippuvuustunnusluvun arvo, jonka perusteella voit päätellä, onko työvuorolla ja leikkijunan kunnolla yhteyttä. Mitkä ovat johtopäätöksesi? (Halutessasi voit käyttää tunnusluvun sijasta sopivaa tilastollista testiä työvuoron ja kunnon yhteyden tutkimiseen.) 6. Kuluttajavirasto on jälleen joulun alla testannut lelujen turvallisuutta. Tutkimukseen valittiin myymälöistä sattumanvaraisesti 101 leikkikalua. Testatuista leluista 69 täytti turvallisuusvaatimukset (Lähde: YLEn uutiset, 9.1.004). Muodosta sellainen 95 %:n luottamusväli, jonka avulla voit arvioida, kuinka monta prosenttia kaikista myytävistä leikkikaluista on turvallisuusvaatimukset täyttäviä. 7. Haluttiin tutkia, parantaako uusi tuotantomenetelmä tuotteen laatua. Vanhan tuotantomenetelmän tuotteista poimittiin 5 alkion otos, josta saatiin laatumittauksen keskiarvoksi 10 ja
keskihajonnaksi 15. Uuden tuotantomenetelmän tuotteista poimittiin 17 alkion otos, josta saatiin keskiarvoksi 15 ja keskihajonnaksi 18. Oletetaan, että molemmissa populaatioissa varianssit ovat samat. Testaa merkitsevyystasolla 0.05, voidaanko otoksien perusteella sanoa, että uudella menetelmällä saadaan keskimäärin parempilaatuisia tuotteita. 8. Oheisessa taulukossa on esitetty kolmen kulutusmuuttujan tilastollisia tunnuslukuja vuodelta 000. Havaintoaineiston tilastoyksiköt ovat Euroopan maita (Lähde: Tilastokeskus, Maailma numeroina.) Tulkitse tuloksia ja vastaa seuraaviin kysymyksiin. Statistics N = havaintojen määrä Mean = keskiarvo Median = mediaani Mode = moodi Std. Deviation = keskihajonta Variance = varianssi Skewness = vinous Kurtosis = huipukkuus Minimum = pienin arvo Maximum = suurin arvo Percentiles = fraktiilit 5 50 75 Viinin kulutus l/henk. Oluen kulutus l/henk. Väkevien kulutus l/henk. 7 7 7 3,333 67,111,81 0,000 59,600 1,900 7,9 3,5 a,4 15,5075 39,6603 1,4754 40,4838 157,9356,1770,48,70 1,175 -,58,37,610 1,0 3,5,5 56,0 160,0 5,6 9,700 37,100 1,00 0,000 59,600 1,900 33,00 95,400,800 a. Multiple modes exist. The smallest value is shown = Moodeja on useita. Niistä esitetään pienin. a) Onko muuttujan Oluen kulutus jakauma normaalijakauma? Perustele vastauksesi. b) Mikä keskiluku sopii nyt kuvaamaan muuttujan Oluen kulutus jakauman keskikohtaa? Perustele vastauksesi. c) Onko muuttujan Viinin kulutus jakauma symmetrinen? Perustele vastauksesi. d) Mikä on muuttujan Väkevien kulutus kvartiilivälin pituus? e) Millä muuttujalla on absoluuttisesti pienin hajonta? Perustele vastauksesi. f) Millä muuttujalla on suhteellisesti suurin hajonta? Perustele vastauksesi. 9. Tietyllä alueella suoritettiin kallioperän nikkelipitoisuuden selvitystyötä. Alueelta valittiin 5 kivinäytettä, joiden nikkelipitoisuuden keskiarvo oli 10. % ja keskihajonta 3.1 %. a) Määritä ko. alueen keskimääräiselle nikkelipitoisuudelle 95 %:n luottamusväli. b) Määritä ko. alueen keskimääräisen nikkelipitoisuuden 99 %:n luottamusväli, kun valittuja kivinäytteitä olisi ollutkin 40 kpl (keskiarvo ja keskihajonta pysyvät samoina). 10. Winnfear Oy:n johtaja on kiinnostunut siitä, onko uimapukujen myynnillä (y) ja kesäkuun päivien keskilämpötilalla (x) yhteyttä. Vuosien varrelta on saatu seuraavia tietoja: x 19 3 5 4 6 1 y 660 740 70 760 780 70 Laske Pearsonin korrelaation arvo ja testaa sen tilastollinen merkitsevyys merkitsevyystasolla 0.05
11. Itikoita inisee juhannuskokon ympärillä. Aikaisempien juhannuskokemusten perusteella tiedät, että todennäköisyys sille, että saat tapetuksia yhden itikan on 0.4. Kokon ympärillä inisee 100 itikkaa. Millä todennäköisyydellä saat tapettua niistä ainakin 35? Vastauksia Tehtävä 1. a) Luokkavälin pituus 4, joten luokkia viisi: päivien lkm työntekijälkm 0 3 1 4 7 7 8 11 5 1 15 3 16 19 5 Yhteensä 3 b) useita vaihtoehtoja, esim. frekvenssihistogramma, summakäyrä tai runkolehtikuvio ja mediaani n. 5 (kuviosta riippuen arvio voi olla hiukan isompikin) c) x = 7.39 ja s = 6.11 ja V = 0.88 Tehtävä. a) Esim. summakäyrästä katsottuna Md noin 45. ja kvartiiliväli noin (44.3, 46.4) b) m i f i m i f i m i 4.45 169.8 708.01 43.45 304.15 1315.3175 44.45 666.75 9637.0375 45.45 77. 33051.4 46.45 35.15 15103.175 47.45 474.5 515.05 48.45 48.45 347.405 716 13077.5 x = 45.3 ja s = 1.5 c) Koska keskiarvo ja mediaani ovat lähes samat, on jakauma melko symmetrinen. Koska kvartiiliväli on melko kapea, on muuttuja-arvojen keskittyminen melko voimakasta. Tehtävä 3. a) Nominaali-, ordinaali-, intervalli- ja suhdeasteikko b) Koska nominaaliasteikolla ei saa käyttää muuttuja-arvoihin aritmeettisia laskutoimituksia, voi jakauman esittää sellaisilla tilastomenetelmillä, jotka perustuvat lukumäärien laskemiseen. Jakaumaa voi siten kuvailla esim. frekvenssijakaumataulukolla, pylväs- tai piirakkakuviolla; tunnusluvuista voi käyttää vain moodia ja entropiaa. Tehtävä 4. a) P(x > 18) = 0.84
b) Φ(0.67) 0.75, joten Q 3. Tehtävä 5. Riippuvuuslukuna voi käyttää kontingenssikerrointa. Seuraavassa taulukossa on teoreettiset frekvenssit Leikkijunan kunto toimiva ei-toimiva Yhteensä Työvuoro aamuvuoro 473 30 503 päivävuoro 551 35 586 iltavuoro 336 1 357 Yhteensä 1360 86 1446 χ C = = ( 473 473) ( 30 30) ( 560 551) ( 6 35) ( 37 336) ( 30 1) 473 6.6 6.6 1446 0.07 30 551 35 336 1 6.6 Kontingenssikertoimen arvo niin lähellä lukua 0, että kunnolla ja työvuorolla ei ole yhteyttä. Tehtävä 6. n = 101 Otoksessa turvallisia leluja oli P = 69 100 = 68.3 %; α = 0.05, z = 1.96 101 0.05 95 %:n luottamusväli turvallisten lelujen prosenttiosuudelle on (59., 77.4) Tehtävä 7. Vanha Uusi n 1 = 5 n = 17 x 1 = 10 x = 15 s 1 = 15 s = 18 Käytetään kahden riippumattoman otoksen keskiarvotesteistä sitä t-versiota, jossa populaatioiden varianssit σ 1 ja σ oletetaan yhtäsuuriksi eli σ 1 = σ = σ Hypoteesit: H 0 : μ 1 = μ H 1 : μ 1 < μ Määritetään populaatioiden yhteisen varianssin σ estimaatti: s = (5 1) 15 (17 1) 18 5 17 = 64.6, joten yhteisen keskihajonnan σ estimaatti on s = 16.66 α = 0.05; t 0.05 (5 17 - ) = t 0.05 (40) = 1.684 ja kriittinen alue C = {t t < -1.684}
10 15 t = = -0.98 ei ole kriittisellä alueella, 1 1 16.66K 5 17 joten vanha ja uusi menetelmä keskimäärin samanlaisia laadultaan Tehtävä 8. a) ei ole, koska jakauma ei ole symmetrinen, vaan oikealle loiveneva (vinous > 0.5) b) mediaaniarvo 59.6 (koska jakauma ei ole symmetrinen) c) kohtalaisen symmetrinen, koska vinous välillä (-0.5, 0.5) d) kvartiilivälin pituus =.8 1. = 1.6 e) keskihajonta mittaa absoluuttista hajaantumista, ja pienin keskihajonta on väkevien kulutuksella f) suhteellista hajaantumista mittaa variaatiokerroin ( keskihajonnan ja keskiarvon suhde) ja suurin variaatiokerroin (0.665) on viinin kulutuksella Tehtävä 9. Sekä a) että b) kohdissa ei tunneta populaatiovarianssia σ, joten luottamusväli populaation keskiarvolle määritetään sen esityksen avulla, missä käytetään t-jakaumaa. a) n = 5, x = 10. ja s = 3.1 α = 0.05, t 0.05 (5-1) =.064 95 %:n luottamusväli koko alueen keskimääräiselle nikkelipitoisuudelle on siten (10..064 3.1, 10..064 3.1 ) = (8.9, 11.5) 5 5 b) n = 40, x = 10. ja s = 3.1 α = 0.01, t 0.005 (40-1) t 0.005 (40) =.704 99 %:n luottamusväli koko alueen keskimääräiselle nikkelipitoisuudelle on siten (10..704 3.1, 10..704 3.1 ) = (8.9, 11.5) 40 40 Tehtävä 10. 138 4380 10100 r = 6 138 4380 308 306000 6 6 = 0.851 Hypoteesit: H 0 : ρ = 0 (eli lämpötilan ja myynnin välillä ei ole lineaarista riippuvuutta) H 1 : ρ 0 (eli lämpötilan ja myynnin välillä on lineaarista riippuvuutta) α = 0.05; t 0.05 (6-) =.776 ja kriittinen alue C = {t t >.776}
t = 0.851 1 0.851 6 = 3.4 Testisuureen arvo on kriittisellä alueella, joten nollahypoteesi hylätään ja vastahypoteesi hyväksytään, joten keskilämpötilan ja uimapukujen myynnin välillä on lineaarista riippuvuutta. Riippuvuus on positiivista ja sehän tarkoittaa, että mitä lämpimämpi kesäkuu on ollut, sitä enemmän on uimapukujakin myyty. Tehtävä 11. x = tapettujen itikoiden lkm, jakaumana Bin(100, 0.4) likimain jakaumana N(40, 4) P(x > 35) = 1- Φ( 35 40 ) 0.85 4