Hannu mies LTK 180 Johanna nainen HuTK 168 Laura nainen LuTK 173 Jere mies NA 173 Riitta nainen LTK 164

Samankaltaiset tiedostot
Til.yks. x y z

1. Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet

pisteet Frekvenssi frekvenssi Yhteensä

1.Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet

KURSSIKYSELYAINEISTO: HUOM! Aineiston tilastoyksikkömäärä 11 on kovin pieni oikean tilastotieteen tekemiseen, mutta Harjoitteluun se kelpaa kyllä!

Til.yks. x y z

The decimal point is 1 digit(s) to the right of the

Sovellettu todennäköisyyslaskenta B

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Johdatus tilastotieteeseen Tilastollisten aineistojen kuvaaminen. TKK (c) Ilkka Mellin (2005) 1

Esimerkki 1: auringonkukan kasvun kuvailu

Tilastollisten aineistojen kuvaaminen

Metsämuuronen: Tilastollisen kuvauksen perusteet ESIPUHE... 4 SISÄLLYSLUETTELO METODOLOGIAN PERUSTEIDEN KERTAUSTA AINEISTO...

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Tilastolliset toiminnot

Esim. Pulssi-muuttujan frekvenssijakauma, aineisto luentomoniste liite 4

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

1.9 Harjoituksia. Frekvenssijakaumien harjoituksia. MAB5: Tilastotieteen lähtökohdat. a) Kaikki aakkoset b) Kirjaimet L, E, M, C, B, A ja i.

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Kandidaatintutkielman aineistonhankinta ja analyysi

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

7. laskuharjoituskierros, vko 10, ratkaisut

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

1.1 Tilastotieteen peruskäsitteitä

Harjoittele tulkintoja

Mat Tilastollisen analyysin perusteet. Tilastollisten aineistojen kerääminen ja mittaaminen Tilastollisten aineistojen kuvaaminen Väliestimointi

Näistä standardoiduista arvoista laskettu keskiarvo on nolla ja varianssi 1, näin on standardoidulle muuttujalle aina.

Pylväsdiagrammi Suomen kunnat lääneittäin vuonna Piirakkadiagrammi Suomen kunnat lääneittäin vuonna 2003 LKM 14.8% 11.2% 19.7% 4.9% 3.6% 45.

Näistä standardoiduista arvoista laskettu keskiarvo on nolla ja varianssi 1, näin on standardoidulle muuttujalle aina.

Määrällisen aineiston esittämistapoja. Aki Taanila

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Kvantitatiiviset menetelmät

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

3 Mittaamisen taso ja tilaston keskiluvut

JOHDATUS TILASTOTIETEESEEN (806118P)

1 TILASTOMATEMATIIKKA TILASTOTIETEEN PERUSKÄSITTEITÄ MUUTTUJAT FREKVENSSIJAKAUMA AINEISTON LUOKITTELU...

b6) samaan perusjoukkoon kohdistuu samanaikaisesti useampia tutkimuksia.

Teema 5: Ristiintaulukointi

Kaksiulotteinen normaalijakauma Mitta-asteikot Havaintoaineiston kuvaaminen ja otostunnusluvut

A-OSA. Kyseessä on binomitodennäköisyys. 30 P(Tasan 10 sadepäivää ja muut 20 poutapäiviä) 0,35 (1 0,35) ,35 0, ,

Määrällisen aineiston esittämistapoja. Aki Taanila

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

GeoGebra tutkivan oppimisen välineenä: havainto-hypoteesi-testaus

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

805306A Johdatus monimuuttujamenetelmiin, 5 op

Huippu Kertaus Tehtävien ratkaisut Kustannusosakeyhtiö Otava päivitetty

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

TUTKIMUSKURSSI I (407040A-02), OSA A), KVANTITATIIVISEN TUTKIMUKSEN PERUSKURSSI, TILASTOLLISET ANALYYSIMENETELMÄT

tilastotieteen kertaus

Järvi 1 Valkjärvi. Järvi 2 Sysijärvi

Teema 3: Tilastollisia kuvia ja tunnuslukuja

Taloyhtiöiden jätehuoltopalvelut

MTTTP1, luento KERTAUSTA JA TÄYDENNYSTÄ. Tunnusluvut. 1) Sijainnin tunnuslukuja. Keskilukuja moodi (Mo) mediaani (Md) keskiarvo, kaava (1)

4. Seuraavaan ristiintaulukkoon on kerätty tehtaassa valmistettujen toimivien ja ei-toimivien leikkijunien lukumäärät eri työvuoroissa:

Tilastotieteen kertaus. Kuusinen/Heliövaara 1

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

Juuri 10 Tehtävien ratkaisut Kustannusosakeyhtiö Otava päivitetty

Kuvioita, taulukoita ja tunnuslukuja. Aki Taanila

3. a) Mitkä ovat tilastolliset mitta-asteikot? b) Millä tavalla nominaaliasteikollisen muuttujan jakauman voi esittää?

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170

2. Aineiston kuvailua

MONISTE 2 Kirjoittanut Elina Katainen

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu

Harjoitus 2: Matlab - Statistical Toolbox

SPSS-pikaohje. Jukka Jauhiainen OAMK / Tekniikan yksikkö

2.6 Frekvenssien kuvaamisesta

14 Jatkuva jakauma. Käsitellään kuitenkin ennen täsmällisiä määritelmiä johdatteleva

b1) harhattomuutta, b2) helppoutta, b3) herkkyyttä, b4) mitta-asteikkoa, b5) standardointia, b6) tarkkuutta.

RISTIINTAULUKOINTI JA Χ 2 -TESTI

Mediaani. Keskihajonta

TILASTOTIETEEN PERUSTEET, kl 2011

SPSS-perusteet. Sisältö

806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy (1 α) = 99 1 α = 0.

MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op)

Tutkimusmenetelmät I Määrällisen tutkimuksen osuus (2.5 op) "kynä-paperi"-harjoitukset/til

MTTTP1, luento KERTAUSTA

Ennen seuraavia tehtäviä tarkista, että KUNNAT-aineistossasi on 12 muuttujaa ja 416 tilastoyksikköä.

Johdatus tilastotieteeseen Tilastollisten aineistojen kerääminen ja mittaaminen. TKK (c) Ilkka Mellin (2005) 1

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Teema 7: Todennäköisyyksien laskentaa

Muuttujien määrittely

Matin alkuvuoden budjetti

Ennen seuraavia tehtäviä tarkista, että KUNNAT-aineistossasi on 12 muuttujaa ja 416 tilastoyksikköä.

Ilmoittaudu Weboodissa klo (sali L4) pidettävään 1. välikokeeseen!

Mittaaminen menettely (sääntö), jolla tilastoyksikköön liitetään tiettyä ominaisuutta kuvaava luku, mittaluku.

Luentotesti 3. Kun tutkimuksen kävelynopeustietoja analysoidaan, onko näiden tutkittavien aiheuttama kato

Tilastoja yleisurheillen

Tehtävät 1/11. TAMPEREEN YLIOPISTO Informaatiotieteiden tiedekunta Valintakoe Matematiikka ja tilastotiede. Sukunimi (painokirjaimin)

Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

Lukion ainevalinnat ja opiskelijarekrytointi, aineyhdistelmä biologia maantiede

Tilastotieteen johdantokurssin harjoitustyö. 1 Johdanto Aineiston kuvaus Riippuvuustarkastelut...4

Lukion ainevalinnat ja opiskelijarekrytointi, aineyhdistelmä biologia terveystieto psykologia

11. laskuharjoituskierros, vko 15, ratkaisut

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

PRO GRADU -TUTKIELMA. Hanna Lindholm. Tilasto-ohjelma Pivotti. Pivotti toimii MS Excel-ohjelmassa ja hyödyntää Excelin PivotTablea

MTTTP1, luento KERTAUSTA

Populaatio tutkimusobjektien muodostama joukko, johon tilastollinen tutkimus kohdistuu, koko N

Transkriptio:

86118P JOHDATUS TILASTOTIETEESEEN Harjoituksen 3 ratkaisut, viikko 5, kevät 19 1. a) Havaintomatriisissa on viisi riviä (eli tilastoyksikköä) ja neljä saraketta (eli muuttujaa). Hannu mies LTK 18 Johanna nainen HuTK 168 Laura nainen LuTK 173 Jere mies NA 173 Riitta nainen LTK 164 (R-ohjelmistolla puuttuvan tiedon merkki on oletusarvoisesti NA, yllä olevassa matriisissa puuttuvaa tietoa voisi merkitä myös esim. pisteellä). b) Autojen nopeusmittarien testaaminen. b1) Nopeuden pistekuvio: B A 98 99 1 2 3 4 5 Nopeus (km/h) b2) Auton B nopeusmittari on harhaton (ei systemaattista virhettä), kun taas auton A nopeusmittari on selvästi harhainen. A:n mittari näyttää systemaattisesti liian suuria nopeuslukemia. Auton A nopeusmittari on tarkka, sen toistettavuuus eli konsistenssi on kunnossa. Auton B nopeusmittarin mittaustulokset vaihtelevat paljon enemmän kuin autolla A, joten auton B nopeusmittarin konsistenssi on selvästi auton A mittaria huonompi. 2. Henkilön B ikäarviot vuosina. a) Biokemistien tekemät arviot. v 1 v TAI v 1 v 2 4 2 4556778888889 2 556778888889 3 1345668 3 134 4 5 3 5668 4 4 5 1

b) Biokemistien (n = 22) laatikko-jana - kuvion piirtämistä varten tarvittavat tunnusluvut: Min = x (1) = 24 v Alakvartiili Q 1 : n/4 = 22/4 = 5.5 Q 1 = x (6) = 27 v Mediaani Md : n/2 = 22/2 = 11 Md = x (11)+x (12) 2 = 28+28 2 = 28 v Yläkvartiili Q 3 : 3n/4 = 3 22/4 = 16.5 Q 3 = x (17) = 34 v Maks = x (n) = x (22) = 45 v Maantieteilijöiden vastaavat havaintoarvot saadaan suoraan R-tulostuksesta: min = 24, Q 1 =, Md = 32, Q 3 = 35 ja maks = 48. Vertailua varten tarvittava laatikko-jana -kuvio on BIOK MAAN 25 35 45 Arvion henkilön B iästä (v) Keskimääräinen ikäarvio näyttäisi olevan maantieteilijöillä korkeampi kuin biokemisteillä. Kun vaihtelun määrää mitataan kvartiilivälin pituudella, biokemistien arviot näyttävät vaihtelevan hieman enemmän. (Vaihteluvälillä mitattuna toisin päin.) 3. Tauluun osuneet pallot. a) Suhdeasteikon diskreetti muuttuja. b) Tauluun osuneiden pallojen frekvenssijakauma (kaksi oikeanpuoleisinta saraketta ovat c)-kohdassa kysyttyä summajakaumaa): Tauluun osuneiden pallojen lkm f %f F %F 16 11 16 11 1 37 25 53 36 2 62 42 115 77 3 34 23 149 2

1 2 3 Tauluun osuneiden pallojen lkm c) Summajakauma esitetty b)-kohdassa. (Suhteellisen) summajakauman graafinen esitys. 8 % F 1 1 2 3 4 Tauluun osuneiden pallojen lkm Huom.: Kohtien b) ja c) kuvatyypin valinta perustuu siihen, että kuvattava muuttuja on vähintään välimatka-asteikkoa, diskreetti ja siitä on havaittu aineistossa vain muutamia erillisiä arvoja. 4. Esineen painon arviointi. a) Esitetyn frekvenssijakauman luokitus on tasavälinen, joten histogrammia varten frekvenssejä ei tarvitse korjata. Painoarvioiden histogrammi 19 39 59 79 8 99 3

b) Esitetyn frekvenssijakauman luokitus ei ole nyt tasavälinen, joten histogrammia piirrettäessä on käytettävä korjattuja frekvenssejä. Lisäksi ei-tasavälinen luokitus on otettava huomioon histogrammin pylväiden leveyksissä. Arvio esineen painosta (v) f %f Luokan pituus 19 44 195 ( 5) = 39 66 44 395 195 = 99 39 26 995 395 = Valitaan perusluokaksi luokka 39, koska ko. luokassa luokkavälin pituus on lyhin luokituksessa esiintyvä luokkavälin pituus. Eri luokkien korjatut frekvenssit h i ovat: Luokka 19: h 1 = 44 (/) = 44 Luokka 39: h 2 = 66 (/) = 66 Luokka 99: h 3 = 39 (/) = 13 Painoarvioiden jakauma histogrammina: Painoarvioiden histogrammi 66 Korjattu frekvenssi 44 39 19 39 99 5. Harjoituksen 1 tehtävässä 4 tarkasteltu taulukko: Opiskelijan opintosuunta Sukupuoli Biokemia Biologia Maantiede Muu Mies 15 17 9 Nainen 12 61 21 6 a) Opintosuunnan frekvenssijakauma: Opiskelijan opintosuunta f %f Biokemia 22 14.6 Biologia 76.3 Maantiede 38 25.2 Muu 15 9.9 Yhteensä 151 4

b) Opintosuunta on mitta-asteikoltaan luokitteluasteikkoa, joten kuvataan jakauma pylväskuvion avulla. Kuviossa luokat järjestetään frekvenssien mukaan suuruusjärjestykseen. 8 Biol Maan Biok Muu Opiskelijan opintosuunta 6. Esineen painon arviointi. a) Kuvattava frekvenssijakauma luokkakeskuksilla (X i ) täydennettynä. Arvio esineen painosta (g) f %f Luokkakeskus X i 19 44 95 39 66 44 295 59 33 22 495 79 4 3 695 8 99 2 1 895 Jakauma frekvenssimonikulmiona: 5 95 295 495 695 895 95 5

b) Painoarvioiden summajakauma Arvio esineen painosta (g) f %f F %F 19 44 44 39 66 44 1 74 99 39 26 149 (Prosenttinen) summajakauma graafisesti: Prosenttinen summafrekvenssi 9 8 8 9 6