Metsämuuronen: Tilastollisen kuvauksen perusteet ESIPUHE... 4 SISÄLLYSLUETTELO... 6 1. METODOLOGIAN PERUSTEIDEN KERTAUSTA... 8 2. AINEISTO...



Samankaltaiset tiedostot
Sisällysluettelo ESIPUHE 1. PAINOKSEEN... 3 ESIPUHE 2. PAINOKSEEN... 3 SISÄLLYSLUETTELO... 4

Sisällysluettelo LUKU I METODOLOGIAN PERUSTEET IHMISTIETEISSÄ ESIPUHE...III ESIPUHE KIRJAN TOISEEN PAINOKSEEN... VIII SISÄLLYSLUETTELO...

Til.yks. x y z

Kvantitatiiviset menetelmät

Kandidaatintutkielman aineistonhankinta ja analyysi

5. Keskiluvut. luokan väliin, ei sen määrääminen tuota vaikeuksia. Näin on seuraavissa esimerkeissä:

Sisältö. Perusteiden Kertaus. Tilastollinen analyysi. Peruskäsitteitä. Peruskäsitteitä. Kvantitatiivinen metodologia verkossa

ALKUSANAT... 4 ALKUSANAT E-KIRJA VERSIOON... 5 SISÄLLYSLUETTELO... 6

Esim. Pulssi-muuttujan frekvenssijakauma, aineisto luentomoniste liite 4

Til.yks. x y z

1. Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet

Kvantitatiiviset tutkimusmenetelmät maantieteessä

Sovellettu todennäköisyyslaskenta B

3. a) Mitkä ovat tilastolliset mitta-asteikot? b) Millä tavalla nominaaliasteikollisen muuttujan jakauman voi esittää?

Hannu mies LTK 180 Johanna nainen HuTK 168 Laura nainen LuTK 173 Jere mies NA 173 Riitta nainen LTK 164

pisteet Frekvenssi frekvenssi Yhteensä

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

SISÄLTÖ 1 TILASTOJEN KÄYTTÖ...7 MITÄ TILASTOTIEDE ON?

Tilastollisten aineistojen kuvaaminen

Johdatus tilastotieteeseen Tilastollisten aineistojen kuvaaminen. TKK (c) Ilkka Mellin (2005) 1

Ohjeita kvantitatiiviseen tutkimukseen

Järvi 1 Valkjärvi. Järvi 2 Sysijärvi

1.Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet

KURSSIKYSELYAINEISTO: HUOM! Aineiston tilastoyksikkömäärä 11 on kovin pieni oikean tilastotieteen tekemiseen, mutta Harjoitteluun se kelpaa kyllä!

MTTTP1, luento KERTAUSTA

Sisällysluettelo LUKU I METODOLOGIAN PERUSTEET IHMISTIETEISSÄ

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

MTTTP1, luento KERTAUSTA

Sovellettu todennäköisyyslaskenta B

Näistä standardoiduista arvoista laskettu keskiarvo on nolla ja varianssi 1, näin on standardoidulle muuttujalle aina.

Kuvioita, taulukoita ja tunnuslukuja. Aki Taanila

MTTTP1, luento KERTAUSTA JA TÄYDENNYSTÄ. Tunnusluvut. 1) Sijainnin tunnuslukuja. Keskilukuja moodi (Mo) mediaani (Md) keskiarvo, kaava (1)

Näistä standardoiduista arvoista laskettu keskiarvo on nolla ja varianssi 1, näin on standardoidulle muuttujalle aina.

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu

b6) samaan perusjoukkoon kohdistuu samanaikaisesti useampia tutkimuksia.

1 TILASTOMATEMATIIKKA TILASTOTIETEEN PERUSKÄSITTEITÄ MUUTTUJAT FREKVENSSIJAKAUMA AINEISTON LUOKITTELU...

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

1 Aritmeettiset ja geometriset jonot

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

KESKEISET SISÄLLÖT Keskeiset sisällöt voivat vaihdella eri vuositasoilla opetusjärjestelyjen mukaan.

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

MTTTP1, luento KERTAUSTA

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

3 Mittaamisen taso ja tilaston keskiluvut

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

Testejä suhdeasteikollisille muuttujille

VALTA9 Kvantitatiiviset tutkimusmenetelmät ja aineistot

4. Seuraavaan ristiintaulukkoon on kerätty tehtaassa valmistettujen toimivien ja ei-toimivien leikkijunien lukumäärät eri työvuoroissa:

TILASTOLLISTEN MENETELMIEN KIRJO JA KÄYTTÖ LÄÄKETIETEEN TUTKIMUSJULKAISUISSA. Pentti Nieminen

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1

5 Lisa materiaali. 5.1 Ristiintaulukointi

Sisällysluettelo ESIPUHE... 4 ALKUSANAT E-KIRJA VERSIOON... 5 SISÄLLYSLUETTELO JOHDANTO TILASTOLLISEEN PÄÄTTELYYN TODENNÄKÖISYYS...

Huippu Kertaus Tehtävien ratkaisut Kustannusosakeyhtiö Otava päivitetty

TUTKIMUSOPAS. SPSS-opas

Luento JOHDANTO

7. laskuharjoituskierros, vko 10, ratkaisut

Tilastollinen aineisto Luottamusväli

Mittaaminen menettely (sääntö), jolla tilastoyksikköön liitetään tiettyä ominaisuutta kuvaava luku, mittaluku.

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Tilastotieteen johdantokurssin harjoitustyö. 1 Johdanto Aineiston kuvaus Riippuvuustarkastelut...4

Kaksiulotteinen normaalijakauma Mitta-asteikot Havaintoaineiston kuvaaminen ja otostunnusluvut

Sisällysluettelo ESIPUHE KIRJAN 1. PAINOKSEEN...3 ESIPUHE KIRJAN 2. PAINOKSEEN...3 SISÄLLYSLUETTELO...4

Tutkimuksen suunnittelu / tilastolliset menetelmät. Marja-Leena Hannila Itä-Suomen yliopisto / Terveystieteiden tdk

Matematiikka vuosiluokat 7 9

Teema 3: Tilastollisia kuvia ja tunnuslukuja

KAHDEN RYHMÄN VERTAILU

Sisällysluettelo SISÄLLYSLUETTELO...6 LYHYT SANASTO VASTA-ALKAJILLE JOHDATUS PARAMETRITTOMIIN MENETELMIIN...9

Luento KERTAUSTA Kaksiulotteinen jakauma Pisteparvi, Toyota Avensis -farmariautoja

806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy (1 α) = 99 1 α = 0.

HAVAITUT JA ODOTETUT FREKVENSSIT

r = n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit.

TILASTO- JA TALOUSMATEMATIIKKA s. 1

4 LUKUJONOT JA SUMMAT

Tilastomenetelmien lopputyö

RISTIINTAULUKOINTI JA Χ 2 -TESTI

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 9. luento. Pertti Palo

Johdatus Ammattikorkeakoulun matematiikkaan ja fysiikkaan

MONISTE 2 Kirjoittanut Elina Katainen

Tilastotieteen kertaus. Kuusinen/Heliövaara 1

tilastotieteen kertaus

MAY1 Tehtävien ratkaisut Kustannusosakeyhtiö Otava päivitetty Julkaiseminen sallittu vain koulun suljetussa verkossa.

Testit järjestysasteikollisille muuttujille

OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi Luento 2

Hypermedian jatko-opintoseminaari

... Vinkkejä lopputyön raportin laadintaan. Sisältö 1. Johdanto 2. Analyyseissä käytetyt muuttujat 3. Tulososa 4. Reflektio (korvaa Johtopäätökset)

Osa 2: Otokset, otosjakaumat ja estimointi

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Määrällisen aineiston esittämistapoja. Aki Taanila

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

54. Tehdään yhden selittäjän lineaarinen regressioanalyysi, kun selittäjänä on määrällinen muuttuja (ja selitettävä myös):

Laskari 1 P I T U U S

Teema 5: Ristiintaulukointi

Harjoittele tulkintoja

Leikkijunan kunto toimiva ei-toimiva Työvuoro aamuvuoro päivävuoro iltavuoro

031021P Tilastomatematiikka (5 op) kertausta 2. vk:een

Mat Tilastollisen analyysin perusteet, kevät 2007

Johdatus varianssianalyysiin. Vilkkumaa / Kuusinen 1

Transkriptio:

Sisällysluettelo ESIPUHE... 4 ALKUSANAT E-KIRJA VERSIOON... SISÄLLYSLUETTELO... 6 1. METODOLOGIAN PERUSTEIDEN KERTAUSTA... 8 1.1 KESKEISTEN KÄSITTEIDEN KERTAUSTA...9 1.2 AIHEESEEN PEREHTYMINEN...9 1.3 AIEMPAAN TUTKIMUKSEEN TUTUSTUMINEN...10 1.4 TUTKIMUSONGELMAN TÄSMENTÄMINEN...11 1. TUTKIMUSMENETELMÄN VALINTA JA LUOTETTAVUUS...12 2. AINEISTO... 14 TEHTÄVIÄ...17 3. AINEISTON TIIVISTÄMINEN... 18 3.1 FREKVENSSIT JA PROSENTIT...18 3.2 KESKILUVUT...24 3.3 ERIKOISEMPIA KESKIARVOJA...2 3.4 HAJONTALUVUT...26 TEHTÄVIÄ...29 4. RISTIINTAULUKOINTI... 30 4.1 RISTIINTAULUKON RAKENTAMINEN...30 4.2 DIKOTOMINEN RISTIINTAULUKKO...32 4.3 RISTIINTAULUKON ANALYSOINTI...33 χ 2 testi... 33 χ 2 testin tilastollinen päättely... 3 Yatesin jatkuvuuskorjain... 36 Fisherin tarkka testi... 37 TEHTÄVIÄ...39. MITTA-ASTEIKOT JA KORRELAATIO... 40.1 LAATUERO- ELI NOMINAALIASTEIKKO...40 Kontingenssikerroin... 41 Phi-kerroin... 41.2 JÄRJESTYS- ELI ORDINAALIASTEIKKO...42 Spearmanin järjestyskorrelaatiokerroin... 42.3 VÄLIMATKA- JA SUHDEASTEIKKO...44 Pearsonin tulomomenttikorrelaatiokertoimen laskeminen... 44 Korrelaatiokertoimen tulkinta... 47 Korrelaation merkitsevyys... 48 Korrelaatiomatriisi... 48 Korrelaatiokertoimen graafinen tulkinta... 49 Anomaliat korrelaatiokertoimessa... 2 6

Korrelaatioita erikoistilanteisiin... 4 Cohenin Kappa...4 Osittaiskorrelaatio...4 TEHTÄVIÄ... 6. KESKIARVOJEN ERON TESTAAMINEN... 6 6.1 MANN-WHITNEYN U-TESTI...7 U-testin laskeminen... 8 U-testin tulkinta... 60 6.2 T-TESTI...62 Otoskeskiarvon vertaaminen annettuun keskiarvoon... 62 Tilastollinen päättely...63 Kahden ryhmän keskiarvon vertailu... 64 t-testi kun ryhmien varianssit ovat eri suuruisia... 66 Tilastollinen päättely...66 t-testi kun varianssit ovat yhtä suuria... 68 Tilastollinen päättely...69 6.3 USEAMMAN RYHMÄN KESKIARVON VERTAILU...70 TEHTÄVIÄ...70 7. LOPUKSI... 71 LÄHTEET... 72 ASIA- JA HENKILÖHAKEMISTO... 73 TAULUKOT... 7 7

Frekvenssipolygoni Frekvenssien graafisessa kuvauksessa käytetään joskus myös frekvanssipolygonia eli frekvenssimonikulmiota (tosin harvemmin kuin histogrammia). Tällöin yhdistetään kunkin luokan luokkakeskus janalla toisiinsa. Polygonin alkupisteenä on alinta luokkaa edeltävä ns. nollaluokka. Ts. polygoni alkaa nollapisteestä. Samoin polygoni loppuu nollapisteeseen. Tällöin loppupisteenä on viimeisen luokan jälkeen tuleva nollaluokka. f 4 3 2 1 0 22 27 32 37 42 47 2 7 Ikäluokkien luokkakeskus Kuvio. Frekvenssipolygoni 3.2 Keskiluvut Keskiarvo eskiluvuilla tarkoitetaan sellaisia lukuja, joilla pyritään ilmaisemaan aineiston informaatio yhdellä ainoalla luvulla, keskiluvulla. Yleisin tunnettu keskiluku on keskiarvo (merkitään x, M tai k.a.) tai ehkä vielä paremmin ilmaisuna aritmeettinen keskiarvo (mean). Aritmeettinen keskiarvo lasketaan summaamalla kaikki arvot yhteen ja jakamalla numeruksella. Näin siis aineiston koeryhmän iän yhteenlaskettu summa on 26+28+29+30+30+32+32+3+3+37+41+42+47+47+2=43 Summa 43 jaetaan numeruksella eli yhteenlaskettavien määrällä 1. Näin ollen koeryhmän keskimääräinen ikä on 43/1=36.2 vuotta. Aritmeettinen keskiarvo kertoo siis kyseisen muuttujan keskimääräisen arvon. 24

Moodi: Se, mitä on eniten Mediaani: Suuruusjärjestyksessä olevan aineiston keskimmäisin arvo Mikäli halutaan tietää, minkä muuttujan arvon frekvenssi on suurin, puhutaan moodista (Mo). Moodi on siis se muuttujan arvo, jota on eniten. Koeryhmän iällä ei ole selkeää yhtä moodia, vaan moodeja oli 4: 30,32,3 ja 47. Luokitellusta aineistosta huomaamme, että ikäryhmä 30-34 -vuotiaat on moodiluokka. Esimerkkimme tapauksessa moodi ei ole kaikkein järkevin keskiluku, mutta joitakin aineistoja se karakterisoi hyvin. Erityisesti silloin, jos aineistossa on joitakin poikkeavia havaintoja, saattaa moodi antaa aineistosta luotettavamman kuvan kuin keskiarvo. Mediaani (Md) on puolestaan järjestetyn aineiston kaikkein keskimmäisin arvo. Toisin sanoen mediaanin yläpuolelle ja alapuolelle jää 0 % havainnoista. Ikä-muuttujan mediaani on 3, sillä tätä nuorempia on 7 ja vanhempia 7 (itse asiassa pitäisi puhua mediaaniluokasta, sillä keskellä on kaksi saman ikäistä hoitajaa; mediaanin laskeminen jätetään tässä tapauksessa kuitenkin tekemättä). Mediaania käytetään harvoin, mutta terminä se on hyvä tietää. Kvalitatiivista aineistoa moodi ja mediaani saattavat kuvata joskus erittäin oivallisesti, mikäli aineisto on järjestetty. 3.3 Erikoisempia keskiarvoja Aritmeettisen keskiarvon lisäksi on olemassa kaksi muutakin keskiarvoa: geometrinen ja harmoninen keskiarvo. Näistä geometrisen keskiarvon tuntemisella saattaa olla käytännöllistä hyötyä. Geometrinen keskiarvo määritellään siten, että lukujen A ja B geometrinen keskiarvo toteuttaa yhtälön: A G = G B Tästä ratkaisemalla saadaan, että G= A*B. Yleisesti geometrinen keskiarvo on n G= x 1 * x 2 * *x n eli geometrinen keskiarvo on lukujen tulojen niin mones juuri kuin tulontekijöitä on yhteensä. Käytännöllinen esimerkki geometrisen keskiarvon käytöstä on suhteellisen osuuden muutoksen keskiarvo. Voisimme olla kiinnostuneita siitä, kuinka paljon koulutuskustannukset ovat nousseet viimeisten kuuden vuoden ai- 2

aikana. Lähestymme ongelmaa kuluttajaindeksin näkökulmasta, nyt vain koulutuskustannusindeksinä. Indeksi lasketaan seuraavasti: Indeksi = 100* Hinta tänä vuonna Hinta perustasovuonna Perustasovuosi on se vuosi, josta lähtien indeksiä lähdetään laskemaan. Oletetaan että vuosi 199 olisi vuosi, josta lähtien kaikkia kiintoisia koulutuskustannuksia lähdetään tarkkailemaan. Esimerkki on kuvitteellinen sovellus Juha Heikkilän Tilastotieteen ABC kirjan (1993, 142-14) esimerkistä. Vuosi Indeksi Suhteellinen muutos edelliseen vuoteen 199 100-1996 107.8 1.0780 1997 11.9 1.071 1998 129.3 1.116 1999 144.8 1.1199 2000 18.3 1.0932 Voidaan päätellä, että vuodesta 199 vuoteen 2000 koulutuskustannukset ovat nousseet 18.3-100 100* = 8.3 % 100 Koulutuskustannusindeksin keskimääräinen vuosittainen kasvu saadaan geometrisen keskiarvon avulla: G = 1.0780*1.071*1.116*1.11991.0932 = 1.83 (eli vuoden 2000 indeksin arvo) = 1.0962 Indeksi siis kasvoi keskimäärin vuosittain 1.0962 kertaiseksi eli 9.62 %. 3.4 Hajontaluvut Varianssi Hajonta ajontaluvuista ehdottomasti tärkein on varianssi (s 2 ) ja tästä johdettu hajonta (s), jotka kuvaavat arvojen vaihtelua keskiarvon ympärillä. Hyvin yksinkertaisella esimerkillä voidaan osoittaa varianssin merkitys keskiarvon tarkkuuden mittana: Oletetaan kaksi erilaista aineistoa, joilla molemmilla on sama keskiarvo. Kyseisiä aineistoja voidaan kuvata tilanteina 1. ja 2. 26