Kandidaatintutkielman aineistonhankinta ja analyysi

Samankaltaiset tiedostot
TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

HAVAITUT JA ODOTETUT FREKVENSSIT

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

KURSSIKYSELYAINEISTO: HUOM! Aineiston tilastoyksikkömäärä 11 on kovin pieni oikean tilastotieteen tekemiseen, mutta Harjoitteluun se kelpaa kyllä!

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

1.Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

MTTTP1, luento KERTAUSTA

1. Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet

Harjoittele tulkintoja

MTTTP1, luento KERTAUSTA

MTTTP1, luento KERTAUSTA

Esim. Pulssi-muuttujan frekvenssijakauma, aineisto luentomoniste liite 4

Metsämuuronen: Tilastollisen kuvauksen perusteet ESIPUHE... 4 SISÄLLYSLUETTELO METODOLOGIAN PERUSTEIDEN KERTAUSTA AINEISTO...

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

Sisällysluettelo ESIPUHE 1. PAINOKSEEN... 3 ESIPUHE 2. PAINOKSEEN... 3 SISÄLLYSLUETTELO... 4

Korrelaatiokerroin. Hanna Heikkinen. Matemaattisten tieteiden laitos. 23. toukokuuta 2012

Määrällisen aineiston esittämistapoja. Aki Taanila

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

54. Tehdään yhden selittäjän lineaarinen regressioanalyysi, kun selittäjänä on määrällinen muuttuja (ja selitettävä myös):

Til.yks. x y z

3. a) Mitkä ovat tilastolliset mitta-asteikot? b) Millä tavalla nominaaliasteikollisen muuttujan jakauman voi esittää?

Sovellettu todennäköisyyslaskenta B

pisteet Frekvenssi frekvenssi Yhteensä

OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi Luento 2

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

Johdatus tilastotieteeseen Tilastollisten aineistojen kuvaaminen. TKK (c) Ilkka Mellin (2005) 1

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 9. luento. Pertti Palo

Teema 3: Tilastollisia kuvia ja tunnuslukuja

Teema 5: Ristiintaulukointi

Sisällysluettelo SISÄLLYSLUETTELO...6 LYHYT SANASTO VASTA-ALKAJILLE JOHDATUS PARAMETRITTOMIIN MENETELMIIN...9

b6) samaan perusjoukkoon kohdistuu samanaikaisesti useampia tutkimuksia.

SISÄLTÖ 1 TILASTOJEN KÄYTTÖ...7 MITÄ TILASTOTIEDE ON?

Luento KERTAUSTA Kaksiulotteinen jakauma Pisteparvi, Toyota Avensis -farmariautoja

Ennen seuraavia tehtäviä tarkista, että KUNNAT-aineistossasi on 12 muuttujaa ja 416 tilastoyksikköä.

Ennen seuraavia tehtäviä tarkista, että KUNNAT-aineistossasi on 12 muuttujaa ja 416 tilastoyksikköä.

5 Lisa materiaali. 5.1 Ristiintaulukointi

Näistä standardoiduista arvoista laskettu keskiarvo on nolla ja varianssi 1, näin on standardoidulle muuttujalle aina.

Tilastollisten aineistojen kuvaaminen

Mat Tilastollisen analyysin perusteet. Tilastollisten aineistojen kerääminen ja mittaaminen Tilastollisten aineistojen kuvaaminen Väliestimointi

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

Hannu mies LTK 180 Johanna nainen HuTK 168 Laura nainen LuTK 173 Jere mies NA 173 Riitta nainen LTK 164

4. Seuraavaan ristiintaulukkoon on kerätty tehtaassa valmistettujen toimivien ja ei-toimivien leikkijunien lukumäärät eri työvuoroissa:

Kyllä. Kyllä. Jäitkö vielä epävarmaksi: Selvitä antavatko testit samansuuntaisen tuloksen.

Kuvioita, taulukoita ja tunnuslukuja. Aki Taanila

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

Mitä tilastotiede on 7 Historiaa 8 Tilastotieteen nykyinen asema 9 Tilastollisen tutkimuksen vaiheet 10

Määrällisen aineiston esittämistapoja. Aki Taanila

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Kvantitatiiviset menetelmät

Opinnäytetyön ja harjoitustöiden tekijöille

I Tilastollisen aineiston ja analyysin edellytysten tarkistaminen. - Muunnokset, uudelleen koodaaminen, summamuuttujien luominen

Sovellettu todennäköisyyslaskenta B

Til.yks. x y z

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Näistä standardoiduista arvoista laskettu keskiarvo on nolla ja varianssi 1, näin on standardoidulle muuttujalle aina.

805306A Johdatus monimuuttujamenetelmiin, 5 op

Tilastotieteen kertaus. Kuusinen/Heliövaara 1

KAHDEN RYHMÄN VERTAILU

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi. Viikko 5

MTTTP1, luento KERTAUSTA JA TÄYDENNYSTÄ. Tunnusluvut. 1) Sijainnin tunnuslukuja. Keskilukuja moodi (Mo) mediaani (Md) keskiarvo, kaava (1)

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin

Kvantitatiiviset tutkimusmenetelmät maantieteessä

TUTKIMUSKURSSI I (407040A-02), OSA A), KVANTITATIIVISEN TUTKIMUKSEN PERUSKURSSI, TILASTOLLISET ANALYYSIMENETELMÄT

Harjoituksessa tarkastellaan miten vapaa-ajan liikunta on yhteydessä..

OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi. Luento 3

TUTKIMUSOPAS. SPSS-opas

tilastotieteen kertaus

2. Aineiston kuvailua

SPSS-pikaohje. Jukka Jauhiainen OAMK / Tekniikan yksikkö

GeoGebra tutkivan oppimisen välineenä: havainto-hypoteesi-testaus

MONISTE 2 Kirjoittanut Elina Katainen

1 TILASTOJEN KÄYTTÖ 7. Mitä tilastotiede on 7 Historiaa 8 Tilastotieteen nykyinen asema 9 Tilastollisen tutkimuksen vaiheet 10

Tilastolliset toiminnot

Leikkijunan kunto toimiva ei-toimiva Työvuoro aamuvuoro päivävuoro iltavuoro

r = n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit.

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1

Sisältö. Perusteiden Kertaus. Tilastollinen analyysi. Peruskäsitteitä. Peruskäsitteitä. Kvantitatiivinen metodologia verkossa

Tilastollinen aineisto Luottamusväli

Esimerkki 1: auringonkukan kasvun kuvailu

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Tässä harjoituksessa käydään läpi R-ohjelman käyttöä esimerkkidatan avulla. eli matriisissa on 200 riviä (havainnot) ja 7 saraketta (mittaus-arvot)

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

Kvantitatiiviset menetelmät

Tarkista vielä ennen analysoinnin aloittamista seuraavat seikat:

Tulkitse tulokset. Onko muuttujien välillä riippuvuutta? Jos riippuvuutta on, niin millaista se on?

Monitasomallit koulututkimuksessa

Tilaston esittäminen frekvenssitaulukossa ja graafisesti. Keskiluvut luokittelemattomalle ja luokitellulle aineistolle: moodi, mediaani, keskiarvo.

Sovellettu todennäköisyyslaskenta B

RISKITASO. Riskitaso (α) määrittää virhepäätelmän todennäköisyyden. Käytettyjä riskitasoja:

A130A0650-K Tilastollisen tutkimuksen perusteet 6 op Tentti / Anssi Tarkiainen & Maija Hujala

Ohjeita kvantitatiiviseen tutkimukseen

TILASTOLLISTEN MENETELMIEN KIRJO JA KÄYTTÖ LÄÄKETIETEEN TUTKIMUSJULKAISUISSA. Pentti Nieminen

Pylväsdiagrammi Suomen kunnat lääneittäin vuonna Piirakkadiagrammi Suomen kunnat lääneittäin vuonna 2003 LKM 14.8% 11.2% 19.7% 4.9% 3.6% 45.

Transkriptio:

Kandidaatintutkielman aineistonhankinta ja analyysi Anna-Kaisa Ylitalo M 315, anna-kaisa.ylitalo@jyu.fi Musiikin, taiteen ja kulttuurin tutkimuksen laitos Jyväskylän yliopisto 2018

2 Havaintomatriisi Havaintomatriisi sisältää kaikki tutkittavat havaintoyksiköt ja muuttujat Henkilö Sukupuoli Ikä Bruttopalkka ( / kk) Siviilisääty 1 mies 25 2700 naimisissa 2 nainen 43 2100 naimisissa 3 nainen 63 2350 leski 4 nainen 32 3560 naimaton 5 mies 45 4320 naimisissa Havaintoyksikkö Havainto 6 mies 18 0 naimaton Muuttuja

Aineiston kuvailu 3

4 Tilastolliset tunnusluvut Tutkimusaineistoa pyritään yleensä kuvailemaan ja tiivistämään tilastollisten tunnuslukujen avulla. Tarkoituksena on kuvailla mitattujen muuttujien keskeiset ominaisuudet mahdollisimman selkeässä muodossa. Eri mitta-asteikolla mitattuja muuttujia voidaan kuvata erilaisten tunnuslukujen avulla. Tarkasteltaessa yhden muuttujan jakaumaa, oleelliset tunnusluvut ovat keskiluvut ja hajontaluvut.

Keskiluvut Keskiluvut ilmoittavat muuttujan keskimääräisen, tyypillisen tai yleisimmän arvon. Tavoitteena on siis määritellä muuttujan jakauman keskikohta. Keskilukuja ovat Moodi (mode) Mediaani (median) Keskiarvo (mean)

6 Hajontaluvut Hajontaluvut kuvaavat sitä, kuinka laajalle tai suppealle välille havainnot sijoittuvat. Hajontalukuja ovat mm. Vaihteluväli ja kvartiiliväli (range, interquartile range) Järjestysasteikollisille muuttujille Keskihajonta ja varianssi (standard deviation, variance) Välimatka-asteikollisille muuttujille

7 Frekvenssitaulukko (luokitelluille muuttujille) Frekvenssijakauma (frequency distribution) voidaan esittää frekvenssitaulukkona. Frekvenssitaulukossa esitetään usein myös prosentuaaliset frekvenssit (kuinka monta prosenttia havainnoista kuuluu kyseiseen luokkaan). Pääaine frekv % Musiikkikasvatus 10 38 Musiikkitiede 15 58 Muu 1 4 Yhteensä 26 100

Graafinen kuvaaminen 8

Pylväsdiagrammi (bar graph) Pylväsdiagrammi (tai pylväskuvaaja) kuvaa laadullisen muuttujan arvojen frekvenssijakaumaa (joskus myös epäjatkuvan määrällisen muuttujan). 9

10 Piirakkakuvio (pie chart) Pylväsdiagrammin sijaan voi joskus olla parempi käyttää piirakkakuviota (ympyrädiagrammi), esimerkiksi kun halutaan havainnollistaa jonkin kokonaisuuden jakautumista osiin. suomesta 2013 adoptoidut 44 % 56 % tytöt pojat

Histogrammi (histogram) Histogrammilla kuvataan määrällisen jatkuvan muuttujan frekvenssijakaumaa. Kurssilaisten pituusjakauma Frequency 0 1 2 3 4 5 155 160 165 170 175 180 185 190 pituus cm 11

Hajontakuvio (scatter plot) Hajontakuvion (tai sirontakuvion) on koordinaatistoon sijoitettu pistekuvio, jonka avulla havainnollistetaan kahden muuttujan välistä riippuvuutta. 150 160 170 180 190 40 50 60 70 80 90 100 110 pituus paino 12

Analyysimenetelmistä 13

14 Ristiintaulukko (crosstabulation) Kahden muuttujan välisiä riippuvuuksia voidaan tutkia ristiintaulukon avulla. Ristiintaulukko (eli kontingenssitaulu) on siis kaksiulotteinen frekvenssitaulu. Muuttujien täytyy tässäkin tapauksessa olla luokiteltuja. Yhdessä solussa olevaa havaintojen lukumäärää kutsutaan solufrekvenssiksi.

15 Ristiintaulukko muuttujille sukupuoli ja opintopisteet sukupuoli mies nainen yht. 0-19 3 0 3 20-39 4 2 6 op 40-59 9 5 14 60-79 2 4 6 80-99 0 1 1 yht. 18 12 30 Sukupuoli-muuttujan frekvenssijakauma (reuna- tai marginaalijakauma) Opintopiste-muuttujan frekvenssijakauma (reuna- tai marginaalijakauma)

16 Suhteelliset jakaumat Muuttujien välistä riippuvutta voi tarkastella myös suhteellisten (tai prosentuaalisten) frekvenssien kautta, tällöin ryhmien kokoerot eivät häiritse. Lasketaan siis frekvenssien prosentuaaliset osuudet joko sarakkeittain (sarakeprosentit) tai riveittäin riviprosentit. Jos muuttujat riippuvat toisistaan, tämä näkyy erilaisina sarakeprosentteina (tai riviprosentteina). Mikäli muuttujat eivät riipu toisistaan, sarakeprosentit (tai riviprosentit) eivät eroa juurikaan toisistaan.

17 Esimerkki, sarakeprosentit sukupuoli mies nainen yht. 3 0-19 100 = 17 0 3 100 = 10 18 30 4 20-39 100 = 22 2 100 = 17 6 100 = 20 18 12 30 9 op 40-59 100 = 50 5 14 100 = 42 100 = 47 18 12 30 2 60-79 100 = 11 4 100 = 33 6 100 = 20 18 12 30 1 80-99 0 100 = 8 6 100 = 3 12 30 yht. 100 100 100

χ 2 -riippumattomuustesti (Chi-squared test, Fisher s exact test) χ 2 -riippumattomuustesti (khiin neliö -testi) testataa muuttujien välistä riippuvuutta Kahden luokitteluasteikollisen muuttujan testi vrt. ristiintaulukko

Korrelaatio (correlation) Korrelaatio mittaa kahden muuttujan välisen riippuvuuden voimakkuutta (vrt. hajontakuvio). Pearsonin korrelaatiokerroin Kaksi välimatka-asteikollista muuttujaa Soveltuu lineaarisen riippuvuuden voimakkuuden mittaamiseen Spearmanin järjestyskorrelaatiokerroin Kaksi järjestysasteikollista muuttujaa Soveltuu lineaarisen ja monotonisen riippuvuuden mittaamiseen HUOM! Muuttujien välinen korrelaatio ei välttämättä tarkoita sitä, että muuttujien välillä olisi syy-seuraus-suhde.

T-testit T-testeillä voidaan verrata kahden ryhmän keskiarvoja (populaatioiden odotusarvoja). Vaatii välimatka-asteikollisen muuttujan, joka on normaalisti jakautunut (populaatiossa) Riippumattomien otosten t-testi Ryhmät ovat keskenään riippumattomia Riippuvien otosten t-testi Ryhmät riippuvat toisistaan (esim. 2 mittauskertaa samoille henkilöille)

21 Varianssianalyysi (ANOVA) Varianssianalyysillä voidaan tutkia eroavatko ryhmien (>2) keskiarvot tilastollisesti merkitsevästi toisistaan. Vastemuuttujan oltava välimatka-asteikollinen (ja normaalisti jakautunut kussakin perusjoukossa) Selittävät muuttujat (faktorit) luokitteluasteikollisia Havainnot toisistaan riippumattomia (sekä ryhmien välillä että niiden sisällä) Jos eroja löytyy, täytyy tehdä parittaiset vertailut (post hoc) kts. myös toistomittausten varianssianalyysi

22 Parametrittomat testit Mikäli testien oletukset (esim. normaalisuus, välimatka-asteikollisuus) eivät ole voimassa tai havaintoja on vähän, voi käyttää parametrittomia testejä. Riippumattomien otosten t-testi -> Mann-Whitneyn testi Riippuvien otosten t-testi -> Wilcoxonin testi ANOVA -> Kruskal-Wallisin testi toistomittausten ANOVA -> Friedmanin testi