Lisätehtäviä (siis vanhoja tenttikysymyksiä) 1. Erään yrityksen satunnaisesti valittujen työntekijöiden poissaolopäivien määrät olivat vuonna 003: 5, 3, 16, 9, 0, 1, 3,, 19, 5, 19, 11,, 0, 4, 6, 1, 15, 4, 0,, 4, 3, 3, 8, 3, 9, 11, 19, 17, 14, 7 a) Luokittele havainnot tasavälisesti siten, että luokkavälin pituus on 4. Esitä poissaolopäivien frekvenssijakauma taulukkona. b) Muodosta jakaumasta sellainen tilastokuvio, jonka perusteella voit arvioida mediaanin. Mikä on mediaaniarvo? Kuvaile myös lyhyesti arviointitapaasi. c) Laske jakauman aritmeettinen keskiarvo, keskihajonta ja variaatiokerroin.. Sanomalehtipaperin neliömetripainoja tutkittaessa saatiin painon frekvenssijakaumaksi eräässä otoksessa seuraava: paino (g/m ) lukumäärä 4.0 4.9 4 43.0 43.9 7 a) Määritä painojakauman mediaani 44.0 44.9 15 ja kvartiiliväli esim. sopivan kuvion 45.0 45.9 16 avulla. 46.0 46.9 7 b) Määritä painojakauman keskiarvo 47.0 47.9 10 ja keskihajonta. 48.0 48.9 1 c) Kuvaile määrittämiesi tunnuslukujen avulla jakauman muotoa. 3. Metsäntutkimuslaitoksen koealalta mitattiin koivujen läpimittaa (rinnankorkeudelta) ja huomattiin sen olevan normaalijakautunut odotusarvolla 0.5 cm ja varianssina 6.5 cm. a) Kuinka monta prosenttia koivuista on läpimitaltaan ainakin 18 cm? b) Määritä rinnankorkeusläpimitan yläkvartiili. 4. Seuraavaan ristiintaulukkoon on kerätty tehtaassa valmistettujen toimivien ja ei-toimivien leikkijunien lukumäärät eri työvuoroissa: Leikkijunan kunto toimiva ei-toimiva Työvuoro aamuvuoro 473 30 päivävuoro 560 6 iltavuoro 37 30 Laske sellaisen tilastollisen riippuvuustunnusluvun arvo, jonka perusteella voit päätellä, onko työvuorolla ja leikkijunan kunnolla yhteyttä. Mitkä ovat johtopäätöksesi? 5. Kuluttajavirasto on jälleen joulun alla testannut lelujen turvallisuutta. Tutkimukseen valittiin myymälöistä sattumanvaraisesti 101 leikkikalua. Testatuista leluista 69 täytti turvallisuusvaatimukset (Lähde: YLEn uutiset, 9.1.004). Muodosta sellainen 95 %:n luottamusväli, jonka avulla voit arvioida, kuinka monta prosenttia kaikista myytävistä leikkikaluista on turvallisuusvaatimukset täyttäviä.
6. Oheisessa taulukossa on esitetty kolmen kulutusmuuttujan tilastollisia tunnuslukuja vuodelta 000. Havaintoaineiston tilastoyksiköt ovat Euroopan maita (Lähde: Tilastokeskus, Maailma numeroina.) Tulkitse tuloksia ja vastaa seuraaviin kysymyksiin. Statistics N = havaintojen määrä Mean = keskiarv o Median = mediaani Mode = moodi Std. Dev iation = keskihajonta Variance = v arianssi Skewness = v inous Kurt osis = huipukkuus Minimum = pienin arvo Maximum = suurin arvo Percentiles = f raktiilit 5 50 75 a. Multiple modes exist. The smallest value is shown Viinin kulutus l/henk. Oluen kulutus l/henk. Väkev ien kulutus l/henk. 7 7 7 3,333 67,111,81 0,000 59,600 1,900 7,9 3,5 a,4 15,5075 39,6603 1,4754 40,4838 157,9356,1770,48,70 1,175 -,58,37,610 1,0 3,5,5 56,0 160,0 5,6 9,700 37,100 1,00 0,000 59,600 1,900 33,00 95,400,800 = Moodeja on useita. Niistä esitetään pienin. a) Onko muuttujan Oluen kulutus jakauma normaalijakauma? Perustele vastauksesi. b) Mikä keskiluku sopii nyt kuvaamaan muuttujan Oluen kulutus jakauman keskikohtaa? Perustele vastauksesi. c) Onko muuttujan Viinin kulutus jakauma symmetrinen? Perustele vastauksesi. d) Mikä on muuttujan Väkevien kulutus kvartiilivälin pituus? e) Millä muuttujalla on absoluuttisesti pienin hajonta? Perustele vastauksesi. f) Millä muuttujalla on suhteellisesti suurin hajonta? Perustele vastauksesi. 7. Tietyllä alueella suoritettiin kallioperän nikkelipitoisuuden selvitystyötä. Alueelta valittiin 5 kivinäytettä, joiden nikkelipitoisuuden keskiarvo oli 10. % ja keskihajonta 3.1 %. a) Määritä ko. alueen keskimääräiselle nikkelipitoisuudelle 95 %:n luottamusväli. b) Määritä ko. alueen keskimääräisen nikkelipitoisuuden 99 %:n luottamusväli, kun valittuja kivinäytteitä olisi ollutkin 40 kpl (keskiarvo ja keskihajonta pysyvät samoina). 8. Winnfear Oy:n johtaja on kiinnostunut siitä, onko uimapukujen myynnillä (y) ja kesäkuun päivien keskilämpötilalla (x) yhteyttä. Vuosien varrelta on saatu seuraavia tietoja: x 19 3 5 4 6 1 y 660 740 70 760 780 70 Laske Pearsonin korrelaation arvo. (Avuksi x 138, x 308, y 4380, y 306000, x y 10100 ) i i i i 9. Itikoita inisee juhannuskokon ympärillä. Aikaisempien juhannuskokemusten perusteella tiedät, että todennäköisyys sille, että saat tapetuksia yhden itikan on 0.4. Kokon ympärillä inisee 100 itikkaa. Millä todennäköisyydellä saat tapettua niistä ainakin 35? (Voit arvioida sopivalla jakaumalla.) i i
10. Yritys ilmoitti valmistavansa kasvisrasvan markkinaosuudeksi 13.6 %. Kilpailija tutki väitettä poimimalla eri puolilta maata 1 myymälän otoksen, jossa ko. rasvan keskimääräinen markkinaosuus oli 1..% ja markkinaosuuksien keskihajonta 3.6 %. Testaa merkitsevyystasolla 0.05, onko valmistajan ilmoitus oikea. 11. Eräässä isossa populaatiossa 40 % on naisia. Valitaan tästä populaatiosta 4 henkilön otos. Mikä on otoksessa olevien naisten lukumäärän todennäköisyysjakauma? Millä todennäköisyydellä otokseen tuli ainakin kolme naista? 1. Olkoon kahdessa toisistaan riippumattomassa tilastollisessa testissä kummassakin todennäköisyys I lajin virheelle 0.05. Millä todennäköisyydellä ainakin toisessa testissä tehdään I lajin virhe? Vastauksia Tehtävä 1. a) Luokkavälin pituus 4, joten luokkia viisi: päivien lkm työntekijälkm 0 3 1 4 7 7 8 11 5 1 15 3 16 19 5 Yhteensä 3 b) useita vaihtoehtoja, esim. frekvenssihistogrammi, summakäyrä tai runkolehtikuvio ja mediaani n. 5 (kuviosta riippuen arvio voi olla hiukan isompikin) c) x = 7.39 ja s = 6.11 ja V = 0.88 Tehtävä. a) Esim. summakäyrästä katsottuna Md noin 45. ja kvartiiliväli noin (44.3, 46.4) b) m i f i m i f i m i 4.45 169.8 708.01 43.45 304.15 1315.3175 44.45 666.75 9637.0375 45.45 77. 33051.4 46.45 35.15 15103.175 47.45 474.5 515.05 48.45 48.45 347.405 716 13077.5 x = 45.3 ja s = 1.5 c) Koska keskiarvo ja mediaani ovat lähes samat, on jakauma melko symmetrinen. Koska kvartiiliväli on melko kapea, on muuttuja-arvojen keskittyminen melko voimakasta.
Tehtävä 3. a) P(x > 18) = 1- P(x < 18) = 1- ( 18 0.5 ) = 1- [ 1-0.8413 ; 84% 6.5 b) Standardoidun normaalijakauman yläkvartiili (eli 75 %:n fraktiili) on 0.67, koska (0.67) 0.75. Kun satunnaismuuttujan x yläkvartiili Q 3 standardoidaan: Q 3 0.5 täytyy sen vastata luku 0.67 eli saadaan 6.5 yhtälö Q 3 0.5 = 0.67, josta Q 3 =.175 6.5 Tehtävä 4. Riippuvuuslukuna voidaan käyttää kontingenssikerrointa. Seuraavassa taulukossa on esitetty teoreettiset eli odotetut frekvenssit Leikkijunan kunto toimiva ei-toimiva Yhteensä Työvuoro aamuvuoro 473 30 503 päivävuoro 551 35 586 iltavuoro 336 1 357 Yhteensä 1360 86 1446 C 473 473 30 30 560 551 6 35 37 336 30 1 473 6.6 6.6 1446 0.07 30 551 35 336 1 6.6 Kontingenssikertoimen arvo niin lähellä lukua 0, että kunnolla ja työvuorolla ei ole yhteyttä. Tehtävä 5. n = 101 Otoksessa turvallisia leluja oli P = 69 100 = 68.3 %; = 0.05, z = 1.96 101 0.05 95 %:n luottamusväli turvallisten lelujen prosenttiosuudelle on (59., 77.4) Tehtävä 6. a) ei ole, koska jakauma ei ole symmetrinen, vaan oikealle loiveneva eli positiivisesti vino (vinous > 0.5) b) mediaaniarvo 59.6 (koska jakauma ei ole symmetrinen) c) kohtalaisen symmetrinen, koska vinous välillä (-0.5, 0.5) d) kvartiilivälin pituus =.8 1. = 1.6 e) keskihajonta mittaa absoluuttista hajaantumista, ja pienin keskihajonta on väkevien kulutuksella f) suhteellista hajaantumista mittaa variaatiokerroin ( keskihajonnan ja keskiarvon suhde) ja suurin variaatiokerroin (0.665) on viinin kulutuksella
Tehtävä 7. Sekä a) että b) kohdissa ei tunneta populaatiovarianssia, joten luottamusväli populaation keskiarvolle määritetään sen esityksen avulla, missä käytetään t-jakaumaa. a) n = 5, x = 10. ja s = 3.1; = 0.05, t 0.05 (5-1) =.064 95 %:n luottamusväli koko alueen keskimääräiselle nikkelipitoisuudelle on siten (10..064 3.1, 10. +.064 3.1 ) = (8.9, 11.5) 5 5 b) n = 40, x = 10. ja s = 3.1; = 0.01, t 0.005 (40-1) t 0.005 (40) =.704 99 %:n luottamusväli koko alueen keskimääräiselle nikkelipitoisuudelle on siten (10..704 3.1, 10. +.704 3.1 ) = (8.9, 11.5) 40 40 Tehtävä 8. 1384380 10100 r 6 138 4380 308 306000 6 6 = 0.851 Keskilämpötilan ja uimapukujen myynnin välillä on positiivista lineaarista riippuvuutta, ja sehän tarkoittaa, että mitä lämpimämpi kesäkuu on ollut, sitä enemmän on uimapukujakin myyty. Tehtävä 9. x = tapettujen itikoiden lkm, jakaumana Bin(100, 0.4) mutta likimain jakaumana N(40, 4) P(x > 35) = 1- P(x < 35)= 1- ( 35 40 ) 0.85 4 Tehtävä 10. Yhden otoksen keskiarvotesti, populaatiovarianssi tuntematon n = 1, x = 1., s= 3.6 Hypoteesit: H 0 : = 13.6 H 1 : 13.6 = 0.05, t 0.05 (1-1) =.01 ja kriittinen alue C ={ t t >.01} t = 1. 13.6 3.6 / 1 = -1.34 Testisuureen arvo ei ole kriittisellä alueella, joten nollahypoteesi hyväksytään. Valmistajan ilmoitus näyttää oikealta.
Tehtävä 11. x = naisten lukumäärä neljän henkilön satunnaisotoksessa ~ Bin(4, 0.4) P(tuli ainakin kolme naista) = P(x 3) = P(x = 3) + P(x = 4) = Tehtävä 1. P(A testissä 1. lajin virhe) = 0.05 ja P(B testissä 1. lajin virhe) = 0.05 P( ainakin toisessa 1. lajin virhe) = 1- P(1. lajin virhettä ei lainkaan) = 1 P(A testissä ei 1. lajin virhettä) P(B testissä ei 1. lajin virhettä) = 1-0.95 0.95 = 0.0975