Til.yks. x y z

Samankaltaiset tiedostot
Til.yks. x y z

1.Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet

KURSSIKYSELYAINEISTO: HUOM! Aineiston tilastoyksikkömäärä 11 on kovin pieni oikean tilastotieteen tekemiseen, mutta Harjoitteluun se kelpaa kyllä!

1. Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet

Hannu mies LTK 180 Johanna nainen HuTK 168 Laura nainen LuTK 173 Jere mies NA 173 Riitta nainen LTK 164

pisteet Frekvenssi frekvenssi Yhteensä

Esim. Pulssi-muuttujan frekvenssijakauma, aineisto luentomoniste liite 4

4. Seuraavaan ristiintaulukkoon on kerätty tehtaassa valmistettujen toimivien ja ei-toimivien leikkijunien lukumäärät eri työvuoroissa:

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

3. a) Mitkä ovat tilastolliset mitta-asteikot? b) Millä tavalla nominaaliasteikollisen muuttujan jakauman voi esittää?

Leikkijunan kunto toimiva ei-toimiva Työvuoro aamuvuoro päivävuoro iltavuoro

Teema 5: Ristiintaulukointi

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

Johdatus tilastotieteeseen Tilastollisten aineistojen kuvaaminen. TKK (c) Ilkka Mellin (2005) 1

Kvantitatiiviset menetelmät

MTTTP1, luento KERTAUSTA JA TÄYDENNYSTÄ. Tunnusluvut. 1) Sijainnin tunnuslukuja. Keskilukuja moodi (Mo) mediaani (Md) keskiarvo, kaava (1)

Tilastollisten aineistojen kuvaaminen

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

Näistä standardoiduista arvoista laskettu keskiarvo on nolla ja varianssi 1, näin on standardoidulle muuttujalle aina.

Näistä standardoiduista arvoista laskettu keskiarvo on nolla ja varianssi 1, näin on standardoidulle muuttujalle aina.

Pylväsdiagrammi Suomen kunnat lääneittäin vuonna Piirakkadiagrammi Suomen kunnat lääneittäin vuonna 2003 LKM 14.8% 11.2% 19.7% 4.9% 3.6% 45.

Metsämuuronen: Tilastollisen kuvauksen perusteet ESIPUHE... 4 SISÄLLYSLUETTELO METODOLOGIAN PERUSTEIDEN KERTAUSTA AINEISTO...

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

... Vinkkejä lopputyön raportin laadintaan. Sisältö 1. Johdanto 2. Analyyseissä käytetyt muuttujat 3. Tulososa 4. Reflektio (korvaa Johtopäätökset)

Kvantitatiiviset tutkimusmenetelmät maantieteessä

7. laskuharjoituskierros, vko 10, ratkaisut

Kandidaatintutkielman aineistonhankinta ja analyysi

Mediaani. Keskihajonta

Ennen seuraavia tehtäviä tarkista, että KUNNAT-aineistossasi on 12 muuttujaa ja 416 tilastoyksikköä.

Mat Tilastollisen analyysin perusteet. Tilastollisten aineistojen kerääminen ja mittaaminen Tilastollisten aineistojen kuvaaminen Väliestimointi

MTTTP1, luento KERTAUSTA

Sovellettu todennäköisyyslaskenta B

Esimerkki 1: auringonkukan kasvun kuvailu

Ennen seuraavia tehtäviä tarkista, että KUNNAT-aineistossasi on 12 muuttujaa ja 416 tilastoyksikköä.

Harjoittele tulkintoja

Huippu Kertaus Tehtävien ratkaisut Kustannusosakeyhtiö Otava päivitetty

2. Aineiston kuvailua

Laskari 1 P I T U U S

Tilastolliset toiminnot

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MTTTP1, luento KERTAUSTA

5. Keskiluvut. luokan väliin, ei sen määrääminen tuota vaikeuksia. Näin on seuraavissa esimerkeissä:

Mat Tilastollisen analyysin perusteet, kevät 2007

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

GeoGebra tutkivan oppimisen välineenä: havainto-hypoteesi-testaus

Mat Tilastollisen analyysin perusteet, kevät 2007

1 TILASTOMATEMATIIKKA TILASTOTIETEEN PERUSKÄSITTEITÄ MUUTTUJAT FREKVENSSIJAKAUMA AINEISTON LUOKITTELU...

MTTTP1, luento KERTAUSTA

A-OSA. Kyseessä on binomitodennäköisyys. 30 P(Tasan 10 sadepäivää ja muut 20 poutapäiviä) 0,35 (1 0,35) ,35 0, ,

Mittaaminen menettely (sääntö), jolla tilastoyksikköön liitetään tiettyä ominaisuutta kuvaava luku, mittaluku.

Sovellettu todennäköisyyslaskenta B

Populaatio tutkimusobjektien muodostama joukko, johon tilastollinen tutkimus kohdistuu, koko N

Matin alkuvuoden budjetti

Määrällisen aineiston esittämistapoja. Aki Taanila

Tilaston esittäminen frekvenssitaulukossa ja graafisesti. Keskiluvut luokittelemattomalle ja luokitellulle aineistolle: moodi, mediaani, keskiarvo.

Tilastotieteen kertaus. Kuusinen/Heliövaara 1

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi Luento 2

Teema 3: Tilastollisia kuvia ja tunnuslukuja

tilastotieteen kertaus

HAVAITUT JA ODOTETUT FREKVENSSIT

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Juuri 10 Tehtävien ratkaisut Kustannusosakeyhtiö Otava päivitetty

1.1 Tilastotieteen peruskäsitteitä

805306A Johdatus monimuuttujamenetelmiin, 5 op

Sisällysluettelo ESIPUHE 1. PAINOKSEEN... 3 ESIPUHE 2. PAINOKSEEN... 3 SISÄLLYSLUETTELO... 4

Tilastotieteen johdantokurssi kevät2017

AIHE: Tyossa_kouluttautuminen

Luentotesti 3. Kun tutkimuksen kävelynopeustietoja analysoidaan, onko näiden tutkittavien aiheuttama kato

Kuvioita, taulukoita ja tunnuslukuja. Aki Taanila

Korrelaatiokerroin. Hanna Heikkinen. Matemaattisten tieteiden laitos. 23. toukokuuta 2012

Kynä-paperi -harjoitukset. Taina Lehtinen Taina I Lehtinen Helsingin yliopisto

1.9 Harjoituksia. Frekvenssijakaumien harjoituksia. MAB5: Tilastotieteen lähtökohdat. a) Kaikki aakkoset b) Kirjaimet L, E, M, C, B, A ja i.

Järvi 1 Valkjärvi. Järvi 2 Sysijärvi

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

7. Normaalijakauma ja standardipisteet

Aikuiskoulutustutkimus 2006, koulutuksen kesto ja sisältö

r = n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit.

54. Tehdään yhden selittäjän lineaarinen regressioanalyysi, kun selittäjänä on määrällinen muuttuja (ja selitettävä myös):

AIHE: Tyytyvaisyysmittareita

Tehtävät 1/11. TAMPEREEN YLIOPISTO Informaatiotieteiden tiedekunta Valintakoe Matematiikka ja tilastotiede. Sukunimi (painokirjaimin)

Luento JOHDANTO

A130A0650-K Tilastollisen tutkimuksen perusteet 6 op Tentti / Anssi Tarkiainen & Maija Hujala

1. Nollahypoteesi on, että teksti on kirjoitettu lyhyemmällä murteella. Mahdollisiavaihtoehtojaonvainyksieliettäteksti

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

SISÄLTÖ 1 TILASTOJEN KÄYTTÖ...7 MITÄ TILASTOTIEDE ON?

Väliraportti 10 x 10 kokeilusta (tilanne )

Kaksiulotteinen normaalijakauma Mitta-asteikot Havaintoaineiston kuvaaminen ja otostunnusluvut

H0: otos peräisin normaalijakaumasta H0: otos peräisin tasajakaumasta

3 Mittaamisen taso ja tilaston keskiluvut

Tutkimusmenetelmät I Määrällisen tutkimuksen osuus (2.5 op) "kynä-paperi"-harjoitukset/til

AIHE: Tyytyvaisyysmittareita

Tehtävä 1. Hypoteesi: Liikuntaneuvonta on hyvä keino vaikuttaa terveydentilaan. Onko edellinen hypoteesi hyvä tutkimushypoteesi? Kyllä.

Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen., jos otoskeskiarvo on suurempi kuin 13,96. Mikä on testissä käytetty α:n arvo?

Tilastotieteen johdantokurssin harjoitustyö. 1 Johdanto Aineiston kuvaus Riippuvuustarkastelut...4

Transkriptio:

Tehtävien ratkaisuja. a) Tilastoyksiköitä ovat työntekijät: Vatanen, Virtanen, Virtanen ja Voutilainen; muuttujina: ikä, asema, palkka, lasten lkm (ja nimikin voidaan tulkita muuttujaksi, jos niin halutaan) b) Kvalitatiivisia muuttujia: asema; kvantitatiivisia muuttujia: ikä, palkka ja lasten lkm c) ei mitään, kunhan vain tietää miltä sarakkeelta eri muuttuja-arvot löytyvät d) ei mitään, koska ei ole mitään väliä sillä, missä järjestyksessä tilastoyksiköt ovat e) voi vääristää tilastoanalyysin tuloksia, jos on kvantitatiivinen muuttuja f) ok, yleisin tapa esittää puuttuva tieto. Nominaaliasteikkoa ja diskreettejä: Sukup, Asuu, Vars, Työ Ordinaaliasteikkoa ja diskreettejä: Matem, Ydinv, Tuuli/vesi, Pakko Intervalliasteikkoa ja diskreettejä: Vuosi, Kenkä Suhdeasteikkoa ja jatkuvia: Tunnit, Ikä, Pituus 3. Tilastoyksikkönä osallistuja; muuttujina x = sukupuoli ( = mies, = nainen), y = opetusmuoto ( = verkko, = luento) ja z =pistemäärien erotus. Tilastoyksiköitä 33 kpl, joten havaintomatriisissa 33 vaakariviä. Muuttujia 3 kpl, joten havaintomatriisissa varsinaisesti 3 saraketta Til.yks. x y z 0.3 3.5 9 4.7 0 6. 5.6 7 3.4 8.5 9 7.8 4 9.4 5 8. 6-6. 33 33. Voidaan esim. tutkia taustatietoja: montako miestä ja montako naista, kuinka moni seuraa luento-opetusta ja kuinka moni verkko-opetusta ja sitten voidaan tutkia esim.: tapahtuuko kurssilla oppimista (onko erotuksen keskiarvo nollaa suurempi), onko miesten ja naisten piste-eroilla eroa (onko miesten joukossa piste-eron keskiarvo sama kuin naisten joukossa), onko luento- ja verkko-opetuksilla eroa, sopiiko verkko-opetus paremmin miehille vai naisille, sopiiko luento-opetus paremmin miehille vai naisille. 4. Taulukko: vastausvaihtoehto frekvenssi suht. frekv. pros. frekv. t.e.m. 4 0. h.e.m. 3 0.58 6 e.e.e.s.m. 6 0.36 3 h.s.m. 3 0.58 6 t.s.m. 3 0.58 6 Yhteensä 9.000 00

5. a) vaihteluväli (58, 04) ja sen pituus w = 04-58 = 46. b) Koska n = 9, voisi luokkia olla esim.5, koska 5 = 3 > 9 (tai luokkien määrä voisi olla c) Luokkavälin pituus c > 5 46 = 9. ~ 0 d) ja e) Nyt valitaan k = 5 ja c = 0 (huom. mittaustarkkuus d = ) Pituus cm f i 00 p i F i 00 P i 55-64 5 6 5 6 65-74 4 9 47 75-84 4 3 68 85-94 3 6 6 84 95-04 3 6 9 00 Yhteensä 9 00 6. vaihteluväli (-9.4, 45.4) ja sen pituus w = 54.8. n = 33, voisi luokkia olla esim.6, koska 6 = 64 > 33 54.8 luokkavälin pituus c > = 9.33, esim. 0 6 (huom. mittaustarkkuus d = 0.) Frekvenssijakaumasta yksi versio: Testipisteiden erotus -0.0 - -0. 3 0.0-9.9 8 0.0-9.9 8 0.0-9.9 30.0-39.9 40.0-49.9 Yhteensä 33 f i

7. a), b) ja c)

8. Runkolehtikuvio, rungon leveys 0 vuotta : 8 : 3345689 3: 044688 4: 48 5: 0 9. lasten lukumäärä: keskiarvo keskihajonta [( ) ( ) ] =.9 ikä: keskiarvo keskihajonta [( ) ( ) ] = 5.9 0. 58, 6, 6, 6, 64, 65, 67, 7, 73, 75, 80, 8, 83, 89, 9, 94, 95, 03, 04 Vaihteluväli (58, 04) Moodiarvo 6 Mediaani on nousevan suuruusjärjestyksen sijalla 0, joten Md = x (0) = 75 = 3380 = 77.894 9 9 Keskiarvo x 73 80... 75 Keskihajonta s = = 73 80... 75 73 80... 75 9 9 8 6056 3380 9 =4.865 4.865... Variaatiokerroin V = = 0.083 77.894... Alakvartiilin sija nousevassa suuruusjärjestyksessä on k =( ) alakvartiili Q = x (5) = 64 Yläkvartiilin sija nousevassa suuruusjärjestyksessä on k =( ) yläkvartiili Q 3 = x (5) = 9 kvartiiliväli (64, 9) Koska mediaani on keskiarvoa pienempi, on pituuden jakauma oikealle loiveneva eli positiivisesti vino. Pituudet eroavat keskiarvosta keskimäärin lähes 5 cm. Koska kvartiiliväli on pituudeltaan yli 60 % vaihteluvälin pituudesta, on muuttuja-arvojen vaihtelu suhteellisen voimakasta ja siten keskittyminen heikohkoa.

Laatikko-viikset-kuvio:. a) Iän variaatiokerroin on V ikä = 0.084/3.63 = 0.309 ja pituudella V pit = 0.083, joten pituuden vaihtelu suhteellisesti pienempää kuin iän vaihtelu. b) Pituusarvo standardoituna on z pit = (65 77.89)/4.865 = -0.867 ja ikä standardoituna on z ikä = (38 3.63)/0.084 = 0.533, joten iän osalta muistuttaa suhteellisesti enemmän keskiarvoopiskelijaa.. Miehet:,, 3, 3, 4, 4, 4, 5, 5, 5 0 kpl Naiset:,,,,, 3,3,3, 3 9 kpl Miehet: pienin arvo ja suurin arvo 5 mediaanin sijaluvut 5 ja seuraava eli 6, joten Md = 4 alakvartiilin sijaluku k =( ), joten Q = tai/ja 3 tai.75 tai.5 yläkvartiilin sijaluku k =( ), joten Q 3 = 5 Naiset: pienin arvo ja suurin arvo 3 mediaanin sijaluku = 5, joten Md = alakvartiilin sijaluku k =( ), joten Q = yläkvartiilin sijaluku k =( ), joten Q 3 = 3 3. mediaaniluokka on neljäs luokka: 70 79, koska siinä luokassa summafrekvenssi on ensimmäisen kerran suurempi kuin 47/ = 3.5

0 47 mediaani Md 69.5 9 7.5 5 x 5 44.5 354.5 65.5 5 74.5 384.5 33.5 70.46 47 47 varianssi 33.5 s 5 44.5 354.5 64.5 5 74.5 384.5 47 47 keskiarvo 46 33.5 4065.75 47 59.39 Lisäksi voidaan laskea keskiluvuista moodi ja hajontaluvuista esim. vaihteluväli, vaihteluvälin pituus, kvartiiliväli, kvartiilivälin pituus, kvartiilipoikkeama, variaatiokerroin, koska muuttujan mitta-asteikko on suhdeasteikko. 4. a) esim. mediaani, koska jakauma ei ole symmetrinen vaan keskiarvo n. 400 euroa suurempi kuin mediaani. b) pienin suhteellinen vaihtelu on veroprosentilla, koska sillä on pienin variaatiokerroin V = c) sekä veroprosentilla että verotettavilla tuloilla on huipukkuusluku isohko positiivinen, joten molemmat d) verotettavien tulojen vinous on arvoltaan positiivinen, joten sen jakauma on oikealle loiveneva e) 65 vuotta täyttäneiden osuus, koska sen vinous ja huipukkuus ovat lähinnä lukua nolla f) 65 vuotta täyttäneiden osuus, koska standardoituna se on lähinnä lukua nolla, z = 5. Esim. pylväsryhmäkuvio, josta näkee, että miehet näyttävät suhtautuvan myönteisemmin lisäydinvoiman rakentamiseen kuin naiset.

6. Sukupuoli Mies Nainen Yhteensä Käy ansiotöissä Kyllä 6 6 Ei 4 3 7 Yhteensä 0 9 9 ( ) = 0.090; C = 0.069 C max = Muuttujat ovat lähes täysin riippumattomat. 7. Teoreettiset frekvenssit: Laatu Hinta Huono Hyvä Yhteensä Edull 9 3 Keski 0 4 4 Kallis 7 9 Yhteensä 30 45 75 ( ) ( ) ( ) ( ) ( ) ( ) C max = Hinnan ja laadun välillä on riippuvuutta siten, että huonolaatuiset ovat usein halvempia kuin hyvälaatuiset.