3. a) Mitkä ovat tilastolliset mitta-asteikot? b) Millä tavalla nominaaliasteikollisen muuttujan jakauman voi esittää?

Samankaltaiset tiedostot
Leikkijunan kunto toimiva ei-toimiva Työvuoro aamuvuoro päivävuoro iltavuoro

4. Seuraavaan ristiintaulukkoon on kerätty tehtaassa valmistettujen toimivien ja ei-toimivien leikkijunien lukumäärät eri työvuoroissa:

1. Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet

1.Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet

KURSSIKYSELYAINEISTO: HUOM! Aineiston tilastoyksikkömäärä 11 on kovin pieni oikean tilastotieteen tekemiseen, mutta Harjoitteluun se kelpaa kyllä!

pisteet Frekvenssi frekvenssi Yhteensä

Til.yks. x y z

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170

Ennen seuraavia tehtäviä tarkista, että KUNNAT-aineistossasi on 12 muuttujaa ja 416 tilastoyksikköä.

Sovellettu todennäköisyyslaskenta B

Tilastollinen aineisto Luottamusväli

Kvantitatiiviset tutkimusmenetelmät maantieteessä

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

Ennen seuraavia tehtäviä tarkista, että KUNNAT-aineistossasi on 12 muuttujaa ja 416 tilastoyksikköä.

Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen., jos otoskeskiarvo on suurempi kuin 13,96. Mikä on testissä käytetty α:n arvo?

Esim. Pulssi-muuttujan frekvenssijakauma, aineisto luentomoniste liite 4

c) A = pariton, B = ainakin 4. Nyt = silmäluku on5 Koska esim. P( P(A) P(B) =, eivät tapahtumat A ja B ole riippumattomia.

Tilastotieteen kertaus. Kuusinen/Heliövaara 1

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

Tutkimusongelmia ja tilastollisia hypoteeseja: Perunalastupussien keskimääräinen paino? Nollahypoteesi Vaihtoehtoinen hypoteesi (yksisuuntainen)

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

Tulkitse tulokset. Onko muuttujien välillä riippuvuutta? Jos riippuvuutta on, niin millaista se on?

tilastotieteen kertaus

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

HAVAITUT JA ODOTETUT FREKVENSSIT

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 6. luento. Pertti Palo

Mat Tilastollisen analyysin perusteet. Tilastollisten aineistojen kerääminen ja mittaaminen Tilastollisten aineistojen kuvaaminen Väliestimointi

Sovellettu todennäköisyyslaskenta B

Til.yks. x y z

806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy (1 α) = 99 1 α = 0.

Sovellettu todennäköisyyslaskenta B

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

edellyttää valintaa takaisinpanolla Aritmeettinen keskiarvo Jos, ½ Ò muodostavat satunnaisotoksen :n jakaumasta niin Otosvarianssi Ë ¾

Väliestimointi (jatkoa) Heliövaara 1

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu

Estimointi. Vilkkumaa / Kuusinen 1

Kandidaatintutkielman aineistonhankinta ja analyysi

Harjoittele tulkintoja

Metsämuuronen: Tilastollisen kuvauksen perusteet ESIPUHE... 4 SISÄLLYSLUETTELO METODOLOGIAN PERUSTEIDEN KERTAUSTA AINEISTO...

riippumattomia ja noudattavat samaa jakaumaa.

Sovellettu todennäköisyyslaskenta B

1 TILASTOJEN KÄYTTÖ 7. Mitä tilastotiede on 7 Historiaa 8 Tilastotieteen nykyinen asema 9 Tilastollisen tutkimuksen vaiheet 10

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

POPULAATIO. Oikeastaan arvot, joista ollaan kiinnostuneita (mitatut numeeriset suureet, luokittelut).

A130A0650-K Tilastollisen tutkimuksen perusteet 6 op Tentti / Anssi Tarkiainen & Maija Hujala

Sovellettu todennäköisyyslaskenta B

¼ ¼ joten tulokset ovat muuttuneet ja nimenomaan huontontuneet eivätkä tulleet paremmiksi.

1. Tilastollinen malli??

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

Näistä standardoiduista arvoista laskettu keskiarvo on nolla ja varianssi 1, näin on standardoidulle muuttujalle aina.

/1. MTTTP5, luento Normaalijakauma (jatkuu) Binomijakaumaa voidaan approksimoida normaalijakaumalla

Valitaan testisuure, jonka jakauma tunnetaan H 0 :n ollessa tosi.

031021P Tilastomatematiikka (5 op) viikko 5

10. laskuharjoituskierros, vko 14, ratkaisut

Satunnaismuuttujien mittausasteikot 93

Harjoitus 7: NCSS - Tilastollinen analyysi

ABHELSINKI UNIVERSITY OF TECHNOLOGY

MTTTP1, luento KERTAUSTA

Lisätehtäviä ratkaisuineen luentomonisteen lukuihin 2-4 liittyen

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Kaavakokoelma, testikaaviot ja jakaumataulukot liitteinä. Ei omia taulukoita! Laskin sallittu.

dx=5&uilang=fi&lang=fi&lvv=2014

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2005) 1

Ohjeita kvantitatiiviseen tutkimukseen

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1

Näistä standardoiduista arvoista laskettu keskiarvo on nolla ja varianssi 1, näin on standardoidulle muuttujalle aina.

Jos nollahypoteesi pitää paikkansa on F-testisuuren jakautunut Fisherin F-jakauman mukaan

Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit

/1. MTTTP5, luento Normaalijakauma (jatkuu) Binomijakaumaa voidaan approksimoida normaalijakaumalla

Todennäköisyyden ominaisuuksia

Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1

Mitä tilastotiede on 7 Historiaa 8 Tilastotieteen nykyinen asema 9 Tilastollisen tutkimuksen vaiheet 10

Harjoitus 2: Matlab - Statistical Toolbox

Luottamusvälit. Normaalijakauma johnkin kohtaan

Kynä-paperi -harjoitukset. Taina Lehtinen Taina I Lehtinen Helsingin yliopisto

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Johdatus tilastotieteeseen Tilastollisten aineistojen kuvaaminen. TKK (c) Ilkka Mellin (2005) 1

Luento KERTAUSTA Kaksiulotteinen jakauma Pisteparvi, Toyota Avensis -farmariautoja

Estimointi populaation tuntemattoman parametrin arviointia otossuureen avulla Otossuure satunnaisotoksen avulla määritelty funktio

MTTTP1, luento KERTAUSTA

Mat Sovellettu todennäköisyyslasku A

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Sovellettu todennäköisyyslaskenta B

Kuvioita, taulukoita ja tunnuslukuja. Aki Taanila

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin

Tilastollisten aineistojen kuvaaminen

Testit laatueroasteikollisille muuttujille

Estimointi. Otantajakauma

Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

GeoGebra tutkivan oppimisen välineenä: havainto-hypoteesi-testaus

r = n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit.

SISÄLTÖ 1 TILASTOJEN KÄYTTÖ...7 MITÄ TILASTOTIEDE ON?

Osa 2: Otokset, otosjakaumat ja estimointi

MAT Todennäköisyyslaskenta Tentti / Kimmo Vattulainen

/1. MTTTP1, luento Normaalijakauma (jatkoa) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti:

Transkriptio:

Seuraavassa muutamia lisätehtäviä 1. Erään yrityksen satunnaisesti valittujen työntekijöiden poissaolopäivien määrät olivat vuonna 003: 5, 3, 16, 9, 0, 1, 3,, 19, 5, 19, 11,, 0, 4, 6, 1, 15, 4, 0,, 4, 3, 3, 8, 3, 9, 11, 19, 17, 14, 7 a) Luokittele havainnot tasavälisesti siten, että luokkavälin pituus on 4. Esitä poissaolopäivien frekvenssijakauma taulukkona. b) Muodosta jakaumasta sellainen tilastokuvio, jonka perusteella voit arvioida mediaanin. Mikä on mediaaniarvo? Kuvaile myös lyhyesti arviointitapaasi. c) Laske jakauman aritmeettinen keskiarvo, keskihajonta ja variaatiokerroin käyttäen alkuperäisiä havaintoja. Sanomalehtipaperin neliömetripainoja tutkittaessa saatiin painon frekvenssijakaumaksi eräässä otoksessa seuraava: paino (g/m ) lukumäärä 4.0 4.9 4 43.0 43.9 7 a) Määritä painojakauman mediaani 44.0 44.9 15 ja kvartiiliväli. 45.0 45.9 16 b) Määritä painojakauman keskiarvo 46.0 46.9 7 ja keskihajonta. 47.0 47.9 10 c) Kuvaile määrittämiesi tunnus- 48.0 48.9 1 lukujen avulla jakauman muotoa. 3. a) Mitkä ovat tilastolliset mitta-asteikot? b) Millä tavalla nominaaliasteikollisen muuttujan jakauman voi esittää? 4. Metsäntutkimuslaitoksen koealalta mitattiin koivujen läpimittaa (rinnankorkeudelta) ja huomattiin sen olevan normaalijakautunut odotusarvolla 0.5 cm ja varianssina 6.5 cm. a) Kuinka monta prosenttia koivuista on läpimitaltaan ainakin 18 cm? b) Määritä rinnankorkeusläpimitan yläkvartiili. 5. Seuraavaan ristiintaulukkoon on kerätty tehtaassa valmistettujen toimivien ja ei-toimivien leikkijunien lukumäärät eri työvuoroissa: Leikkijunan kunto toimiva ei-toimiva Työvuoro aamuvuoro 473 30 päivävuoro 560 6 iltavuoro 37 30 Laske sellaisen tilastollisen riippuvuustunnusluvun arvo, jonka perusteella voit päätellä, onko työvuorolla ja leikkijunan kunnolla yhteyttä. Mitkä ovat johtopäätöksesi? (Halutessasi voit käyttää tunnusluvun sijasta sopivaa tilastollista testiä työvuoron ja kunnon yhteyden tutkimiseen.) 6. Kuluttajavirasto on jälleen joulun alla testannut lelujen turvallisuutta. Tutkimukseen valittiin myymälöistä sattumanvaraisesti 101 leikkikalua. Testatuista leluista 69 täytti turvallisuusvaatimukset (Lähde: YLEn uutiset, 9.1.004). Muodosta sellainen 95 %:n luottamusväli, jonka avulla voit arvioida, kuinka monta prosenttia kaikista myytävistä leikkikaluista on turvallisuusvaatimukset täyttäviä. 7. Haluttiin tutkia, parantaako uusi tuotantomenetelmä tuotteen laatua. Vanhan tuotantomenetelmän tuotteista poimittiin 5 alkion otos, josta saatiin laatumittauksen keskiarvoksi 10 ja

keskihajonnaksi 15. Uuden tuotantomenetelmän tuotteista poimittiin 17 alkion otos, josta saatiin keskiarvoksi 15 ja keskihajonnaksi 18. Oletetaan, että molemmissa populaatioissa varianssit ovat samat. Testaa merkitsevyystasolla 0.05, voidaanko otoksien perusteella sanoa, että uudella menetelmällä saadaan keskimäärin parempilaatuisia tuotteita. 8. Oheisessa taulukossa on esitetty kolmen kulutusmuuttujan tilastollisia tunnuslukuja vuodelta 000. Havaintoaineiston tilastoyksiköt ovat Euroopan maita (Lähde: Tilastokeskus, Maailma numeroina.) Tulkitse tuloksia ja vastaa seuraaviin kysymyksiin. Statistics N = havaintojen määrä Mean = keskiarvo Median = mediaani Mode = moodi Std. Deviation = keskihajonta Variance = varianssi Skewness = vinous Kurtosis = huipukkuus Minimum = pienin arvo Maximum = suurin arvo Percentiles = fraktiilit 5 50 75 Viinin kulutus l/henk. Oluen kulutus l/henk. Väkevien kulutus l/henk. 7 7 7 3,333 67,111,81 0,000 59,600 1,900 7,9 3,5 a,4 15,5075 39,6603 1,4754 40,4838 157,9356,1770,48,70 1,175 -,58,37,610 1,0 3,5,5 56,0 160,0 5,6 9,700 37,100 1,00 0,000 59,600 1,900 33,00 95,400,800 a. Multiple modes exist. The smallest value is shown = Moodeja on useita. Niistä esitetään pienin. a) Onko muuttujan Oluen kulutus jakauma normaalijakauma? Perustele vastauksesi. b) Mikä keskiluku sopii nyt kuvaamaan muuttujan Oluen kulutus jakauman keskikohtaa? Perustele vastauksesi. c) Onko muuttujan Viinin kulutus jakauma symmetrinen? Perustele vastauksesi. d) Mikä on muuttujan Väkevien kulutus kvartiilivälin pituus? e) Millä muuttujalla on absoluuttisesti pienin hajonta? Perustele vastauksesi. f) Millä muuttujalla on suhteellisesti suurin hajonta? Perustele vastauksesi. 9. Tietyllä alueella suoritettiin kallioperän nikkelipitoisuuden selvitystyötä. Alueelta valittiin 5 kivinäytettä, joiden nikkelipitoisuuden keskiarvo oli 10. % ja keskihajonta 3.1 %. a) Määritä ko. alueen keskimääräiselle nikkelipitoisuudelle 95 %:n luottamusväli. b) Määritä ko. alueen keskimääräisen nikkelipitoisuuden 99 %:n luottamusväli, kun valittuja kivinäytteitä olisi ollutkin 40 kpl (keskiarvo ja keskihajonta pysyvät samoina). 10. Winnfear Oy:n johtaja on kiinnostunut siitä, onko uimapukujen myynnillä (y) ja kesäkuun päivien keskilämpötilalla (x) yhteyttä. Vuosien varrelta on saatu seuraavia tietoja: x 19 3 5 4 6 1 y 660 740 70 760 780 70 Laske Pearsonin korrelaation arvo ja testaa sen tilastollinen merkitsevyys merkitsevyystasolla 0.05

11. Itikoita inisee juhannuskokon ympärillä. Aikaisempien juhannuskokemusten perusteella tiedät, että todennäköisyys sille, että saat tapetuksia yhden itikan on 0.4. Kokon ympärillä inisee 100 itikkaa. Millä todennäköisyydellä saat tapettua niistä ainakin 35? Vastauksia Tehtävä 1. a) Luokkavälin pituus 4, joten luokkia viisi: päivien lkm työntekijälkm 0 3 1 4 7 7 8 11 5 1 15 3 16 19 5 Yhteensä 3 b) useita vaihtoehtoja, esim. frekvenssihistogramma, summakäyrä tai runkolehtikuvio ja mediaani n. 5 (kuviosta riippuen arvio voi olla hiukan isompikin) c) x = 7.39 ja s = 6.11 ja V = 0.88 Tehtävä. a) Esim. summakäyrästä katsottuna Md noin 45. ja kvartiiliväli noin (44.3, 46.4) b) m i f i m i f i m i 4.45 169.8 708.01 43.45 304.15 1315.3175 44.45 666.75 9637.0375 45.45 77. 33051.4 46.45 35.15 15103.175 47.45 474.5 515.05 48.45 48.45 347.405 716 13077.5 x = 45.3 ja s = 1.5 c) Koska keskiarvo ja mediaani ovat lähes samat, on jakauma melko symmetrinen. Koska kvartiiliväli on melko kapea, on muuttuja-arvojen keskittyminen melko voimakasta. Tehtävä 3. a) Nominaali-, ordinaali-, intervalli- ja suhdeasteikko b) Koska nominaaliasteikolla ei saa käyttää muuttuja-arvoihin aritmeettisia laskutoimituksia, voi jakauman esittää sellaisilla tilastomenetelmillä, jotka perustuvat lukumäärien laskemiseen. Jakaumaa voi siten kuvailla esim. frekvenssijakaumataulukolla, pylväs- tai piirakkakuviolla; tunnusluvuista voi käyttää vain moodia ja entropiaa. Tehtävä 4. a) P(x > 18) = 0.84

b) Φ(0.67) 0.75, joten Q 3. Tehtävä 5. Riippuvuuslukuna voi käyttää kontingenssikerrointa. Seuraavassa taulukossa on teoreettiset frekvenssit Leikkijunan kunto toimiva ei-toimiva Yhteensä Työvuoro aamuvuoro 473 30 503 päivävuoro 551 35 586 iltavuoro 336 1 357 Yhteensä 1360 86 1446 χ C = = ( 473 473) ( 30 30) ( 560 551) ( 6 35) ( 37 336) ( 30 1) 473 6.6 6.6 1446 0.07 30 551 35 336 1 6.6 Kontingenssikertoimen arvo niin lähellä lukua 0, että kunnolla ja työvuorolla ei ole yhteyttä. Tehtävä 6. n = 101 Otoksessa turvallisia leluja oli P = 69 100 = 68.3 %; α = 0.05, z = 1.96 101 0.05 95 %:n luottamusväli turvallisten lelujen prosenttiosuudelle on (59., 77.4) Tehtävä 7. Vanha Uusi n 1 = 5 n = 17 x 1 = 10 x = 15 s 1 = 15 s = 18 Käytetään kahden riippumattoman otoksen keskiarvotesteistä sitä t-versiota, jossa populaatioiden varianssit σ 1 ja σ oletetaan yhtäsuuriksi eli σ 1 = σ = σ Hypoteesit: H 0 : μ 1 = μ H 1 : μ 1 < μ Määritetään populaatioiden yhteisen varianssin σ estimaatti: s = (5 1) 15 (17 1) 18 5 17 = 64.6, joten yhteisen keskihajonnan σ estimaatti on s = 16.66 α = 0.05; t 0.05 (5 17 - ) = t 0.05 (40) = 1.684 ja kriittinen alue C = {t t < -1.684}

10 15 t = = -0.98 ei ole kriittisellä alueella, 1 1 16.66K 5 17 joten vanha ja uusi menetelmä keskimäärin samanlaisia laadultaan Tehtävä 8. a) ei ole, koska jakauma ei ole symmetrinen, vaan oikealle loiveneva (vinous > 0.5) b) mediaaniarvo 59.6 (koska jakauma ei ole symmetrinen) c) kohtalaisen symmetrinen, koska vinous välillä (-0.5, 0.5) d) kvartiilivälin pituus =.8 1. = 1.6 e) keskihajonta mittaa absoluuttista hajaantumista, ja pienin keskihajonta on väkevien kulutuksella f) suhteellista hajaantumista mittaa variaatiokerroin ( keskihajonnan ja keskiarvon suhde) ja suurin variaatiokerroin (0.665) on viinin kulutuksella Tehtävä 9. Sekä a) että b) kohdissa ei tunneta populaatiovarianssia σ, joten luottamusväli populaation keskiarvolle määritetään sen esityksen avulla, missä käytetään t-jakaumaa. a) n = 5, x = 10. ja s = 3.1 α = 0.05, t 0.05 (5-1) =.064 95 %:n luottamusväli koko alueen keskimääräiselle nikkelipitoisuudelle on siten (10..064 3.1, 10..064 3.1 ) = (8.9, 11.5) 5 5 b) n = 40, x = 10. ja s = 3.1 α = 0.01, t 0.005 (40-1) t 0.005 (40) =.704 99 %:n luottamusväli koko alueen keskimääräiselle nikkelipitoisuudelle on siten (10..704 3.1, 10..704 3.1 ) = (8.9, 11.5) 40 40 Tehtävä 10. 138 4380 10100 r = 6 138 4380 308 306000 6 6 = 0.851 Hypoteesit: H 0 : ρ = 0 (eli lämpötilan ja myynnin välillä ei ole lineaarista riippuvuutta) H 1 : ρ 0 (eli lämpötilan ja myynnin välillä on lineaarista riippuvuutta) α = 0.05; t 0.05 (6-) =.776 ja kriittinen alue C = {t t >.776}

t = 0.851 1 0.851 6 = 3.4 Testisuureen arvo on kriittisellä alueella, joten nollahypoteesi hylätään ja vastahypoteesi hyväksytään, joten keskilämpötilan ja uimapukujen myynnin välillä on lineaarista riippuvuutta. Riippuvuus on positiivista ja sehän tarkoittaa, että mitä lämpimämpi kesäkuu on ollut, sitä enemmän on uimapukujakin myyty. Tehtävä 11. x = tapettujen itikoiden lkm, jakaumana Bin(100, 0.4) likimain jakaumana N(40, 4) P(x > 35) = 1- Φ( 35 40 ) 0.85 4