Kvantitatiiviset menetelmät

Samankaltaiset tiedostot
TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

Metsämuuronen: Tilastollisen kuvauksen perusteet ESIPUHE... 4 SISÄLLYSLUETTELO METODOLOGIAN PERUSTEIDEN KERTAUSTA AINEISTO...

Til.yks. x y z

Kvantitatiiviset menetelmät

Sovellettu todennäköisyyslaskenta B

Til.yks. x y z

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Kandidaatintutkielman aineistonhankinta ja analyysi

pisteet Frekvenssi frekvenssi Yhteensä

Kuvioita, taulukoita ja tunnuslukuja. Aki Taanila

Mittaaminen menettely (sääntö), jolla tilastoyksikköön liitetään tiettyä ominaisuutta kuvaava luku, mittaluku.

KURSSIKYSELYAINEISTO: HUOM! Aineiston tilastoyksikkömäärä 11 on kovin pieni oikean tilastotieteen tekemiseen, mutta Harjoitteluun se kelpaa kyllä!

Esim. Pulssi-muuttujan frekvenssijakauma, aineisto luentomoniste liite 4

1.Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet

Otannasta ja mittaamisesta

Johdatus tilastotieteeseen Tilastollisten aineistojen kuvaaminen. TKK (c) Ilkka Mellin (2005) 1

Hypermedian jatko-opintoseminaari

1. Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet

Sisällysluettelo ESIPUHE 1. PAINOKSEEN... 3 ESIPUHE 2. PAINOKSEEN... 3 SISÄLLYSLUETTELO... 4

Sisältö. Perusteiden Kertaus. Tilastollinen analyysi. Peruskäsitteitä. Peruskäsitteitä. Kvantitatiivinen metodologia verkossa

Kvantitatiiviset tutkimusmenetelmät maantieteessä

5. Keskiluvut. luokan väliin, ei sen määrääminen tuota vaikeuksia. Näin on seuraavissa esimerkeissä:

Tilastollisten aineistojen kuvaaminen

Hannu mies LTK 180 Johanna nainen HuTK 168 Laura nainen LuTK 173 Jere mies NA 173 Riitta nainen LTK 164

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Harjoitus 2: Matlab - Statistical Toolbox

ALKUSANAT... 4 ALKUSANAT E-KIRJA VERSIOON... 5 SISÄLLYSLUETTELO... 6

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

HAVAITUT JA ODOTETUT FREKVENSSIT

3 Mittaamisen taso ja tilaston keskiluvut

Luento-osuusosuus. tilasto-ohjelmistoaohjelmistoa

7. laskuharjoituskierros, vko 10, ratkaisut

Määrällisen aineiston esittämistapoja. Aki Taanila

MTTTP1, luento KERTAUSTA

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Järvi 1 Valkjärvi. Järvi 2 Sysijärvi

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

MTTTP1, luento KERTAUSTA

Korrelaatiokerroin. Hanna Heikkinen. Matemaattisten tieteiden laitos. 23. toukokuuta 2012

b6) samaan perusjoukkoon kohdistuu samanaikaisesti useampia tutkimuksia.

Teema 3: Tilastollisia kuvia ja tunnuslukuja

MTTTP1, luento KERTAUSTA

1 TILASTOMATEMATIIKKA TILASTOTIETEEN PERUSKÄSITTEITÄ MUUTTUJAT FREKVENSSIJAKAUMA AINEISTON LUOKITTELU...

Määrällisen aineiston esittämistapoja. Aki Taanila

Sovellettu todennäköisyyslaskenta B

Tehtävä 1. Hypoteesi: Liikuntaneuvonta on hyvä keino vaikuttaa terveydentilaan. Onko edellinen hypoteesi hyvä tutkimushypoteesi? Kyllä.

Populaatio tutkimusobjektien muodostama joukko, johon tilastollinen tutkimus kohdistuu, koko N

3. a) Mitkä ovat tilastolliset mitta-asteikot? b) Millä tavalla nominaaliasteikollisen muuttujan jakauman voi esittää?

r = n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit.

II Tilastollisen aineiston ja analyysin edellytysten tarkistaminen

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

805306A Johdatus monimuuttujamenetelmiin, 5 op

Virhearviointi. Fysiikassa on tärkeää tietää tulosten tarkkuus.

... Vinkkejä lopputyön raportin laadintaan. Sisältö 1. Johdanto 2. Analyyseissä käytetyt muuttujat 3. Tulososa 4. Reflektio (korvaa Johtopäätökset)

Huippu Kertaus Tehtävien ratkaisut Kustannusosakeyhtiö Otava päivitetty

Mat Tilastollisen analyysin perusteet. Tilastollisten aineistojen kerääminen ja mittaaminen Tilastollisten aineistojen kuvaaminen Väliestimointi

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 6. luento. Pertti Palo

Mittaustekniikka (3 op)

Havainto ja sen kirjaaminen sekä Itsearvioinnin ja ulkopuolisen havainnoinnin sudenkuoppia. C: Tuomas Leinonen

Matemaattinen Analyysi, k2012, L1

SISÄLTÖ 1 TILASTOJEN KÄYTTÖ...7 MITÄ TILASTOTIEDE ON?

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

HARJOITUSKERTA 1: SPSS-OHJELMAN PERUSKÄYTTÖ JA MUUTTUJAMUUNNOKSET

Viestinnän mentelmät I: sisällön erittely. Sisällönanalyysi/sisällön erittely. Sisällön erittely. Juha Herkman

Menetelmät tietosuojan toteutumisen tukena - käytännön esimerkkejä. Tilastoaineistot tutkijan työvälineenä - mahdollisuudet ja rajat 2.3.

OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi Luento 2

YLEISKUVA - Kysymykset

Tarkista vielä ennen analysoinnin aloittamista seuraavat seikat:

MTTTP1, luento KERTAUSTA JA TÄYDENNYSTÄ. Tunnusluvut. 1) Sijainnin tunnuslukuja. Keskilukuja moodi (Mo) mediaani (Md) keskiarvo, kaava (1)

Tilaston esittäminen frekvenssitaulukossa ja graafisesti. Keskiluvut luokittelemattomalle ja luokitellulle aineistolle: moodi, mediaani, keskiarvo.

Kaavakokoelma, testikaaviot ja jakaumataulukot liitteinä. Ei omia taulukoita! Laskin sallittu.

Luento KERTAUSTA Kaksiulotteinen jakauma Pisteparvi, Toyota Avensis -farmariautoja

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Viestinnän mentelmät I: sisällön erittely. Sisällönanalyysi/sisällön erittely. Sisällön erittely. Juha Herkman

GeoGebra tutkivan oppimisen välineenä: havainto-hypoteesi-testaus

TILASTO- JA TALOUSMATEMATIIKKA s. 1

Sovellettu todennäköisyyslaskenta B

7. Normaalijakauma ja standardipisteet

Tutkimusasetelma, mittaaminen ja otanta

MONISTE 2 Kirjoittanut Elina Katainen

JOHDATUS TILASTOTIETEESEEN (806118P)

1 PROSENTTILASKENTAA 7

805306A Johdatus monimuuttujamenetelmiin, 5 op

4. Seuraavaan ristiintaulukkoon on kerätty tehtaassa valmistettujen toimivien ja ei-toimivien leikkijunien lukumäärät eri työvuoroissa:

Tilastollinen aineisto Luottamusväli

54. Tehdään yhden selittäjän lineaarinen regressioanalyysi, kun selittäjänä on määrällinen muuttuja (ja selitettävä myös):

Liite teokseen Semi Purhonen ym., Suomalainen maku: Kulttuuripääoma, kulutus ja elämäntyylien sosiaalinen eriytyminen (Gaudeamus 2014)

SPSS-pikaohje. Jukka Jauhiainen OAMK / Tekniikan yksikkö

Luentotesti 3. Kun tutkimuksen kävelynopeustietoja analysoidaan, onko näiden tutkittavien aiheuttama kato

Asteikoista ja segmentoinnista

PÖYTYÄN KUNTA, KYRÖN VANHA KOULU TILASTOVERTAILU DNA-ANALYYSEISTÄ

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Taloyhtiöiden jätehuoltopalvelut

Teema 5: Ristiintaulukointi

Muuttujien määrittely

2. Aineiston kuvailua

Leikkijunan kunto toimiva ei-toimiva Työvuoro aamuvuoro päivävuoro iltavuoro

Transkriptio:

Kvantitatiiviset menetelmät HUOM! Tentti pidetään tiistaina.. klo 6-8 Vuorikadulla V0 ls Muuttujien muunnokset Usein empiirisen analyysin yhteydessä tulee tarve muuttaa aineiston muuttujia Esim. syntymävuoden muuttaminen iäksi Kaksi vaihtoehtoa: Uusien muuttujien luominen Muuttujan uudelleenkoodaus Mikko Mattila 005 Mikko Mattila 005 Uusien muuttujien luominen Uusi muuttuja esitetään kaavan avulla Esimerkiksi uuden asukastiheysmuuttujan luominen TIHEYS = ASUKASLUKU / PINTA-ALA Summamuuttujan luominen: SUMMA = KYS + KYS + KYS3 + KYS4 + KYS5 Muuttujien uudelleenkoodaus Alkuperäisen muuttujan koodausta muutetaan Vanha koodaus: Mies=, Nainen= Uusi koodaus: Mies=0, Nainen= Uudelleenkoodaus voidaan tehdä joko alkuperäiseen muuttujaan tai uuteen muuttujaan (suositeltavampaa) Mikko Mattila 005 3 Mikko Mattila 005 4 Muuttujien uudelleenkoodaus Uudelleenkoodausta tarvitaan muuttujan suunnan vaihtoon (pienet arvot vaihdetaan suuriksi ja päinvastoin) Esim. vastaajan terveydentila: erittäin hyvä (), melko hyvä (), kohtalainen (3), melko huono (4) ja erittäin huono (5) Uudelleenkoodausta tarvitaan myös vähintään välimatka-asteikollisen muuttujan luokittelussa ikä <35: uusi arvo ikä 35-59: uusi arvo Ikä >60: uusi arvo 3 Summamuuttujat Summamuuttuja muodostetaan yhdistämällä useita samaa asiaa eri tavalla mittaavia kysymyksiä yhteen muuttujaan laskemalla ne yhteen. SUMMA = KYS + KYS + KYS3 + KYS4 + KYS5 SUMMA = (KYS + KYS + KYS3 + KYS4 + KYS5) / 5 Mikko Mattila 005 5 Mikko Mattila 005 6

Miksi summamuuttujia? Miksi summamuuttujia? Käsitteet moniulotteisia mittaaminen yhdellä kysymyksellä kattavasti vaikeaa (esim. konservatiivisuus ) mittauksen validiteetti paranee. Mittarin reliabiliteetti paranee satunnaisvirheen vaikutus vähenee. Mittarin tarkkuus paranee tarkemmat luokittelut mahdollisia. Empiirinen analyysi helpottuu voi keskittyä yhteen muuttujaan tarkemmin usean muuttujan sijasta Mikko Mattila 005 7 Mikko Mattila 005 8 Huomioitavia asioita Summamuuttujaa rakennettaessa kiinnitettävä huomiota seuraaviin seikkoihin: Kysymysten on oltava samansuuntaisia eli suuri arvo kuvaa jokaisen kysymyksen kohdalla mitattavan käsitteen jompaa kumpaa ääripäätä (jos näin ei ole uudelleenkoodaa poikkeavat kysymykset). Huomioitavia asioita Kysymysten on oltava samalla numeerisella asteikolla (jos näin ei ole uudelleenkoodaa poikkeavat kysymykset). Summamuuttujan reliabiliteetti mitattava yleensä käytetään ns. Cronbachin α lukua (peukalosääntö: jos α on suurempi kuin 0,7 summamuuttuja on hyväksyttävissä) Mikko Mattila 005 9 Mikko Mattila 005 0 Puuttuvat havainnot Lähes kaikissa aineistoissa on muuttujia ja havaintoyksikköjä, joista ei ole pystytty mittaamaan kaikki arvoja puuttuvien havaintojen ongelma Seuraukset: Aineiston pieneneminen Tulosten mahdollinen vääristyminen Syitä: Puuttuvat havainnot Ei tarkoituskaan vastata (esim. lasten ikä, jos vastaajalla ei ole lapsia) Kieltäytyy vastaamasta Vastaus epäselvä Vastaaja ei tiedä tai hänellä ei ole mielipidettä Vahinko tai viitseliäisyyden puute Koodaus- tai tallennevirhe Syystä ei ole tietoa Mikko Mattila 005 Mikko Mattila 005

Puuttuvien havaintojen poistaminen analyysista Helppo ratkaisu, esim. SPSS-ohjelmassa määritellään tietyt muuttujien arvot puuttuviksi tiedoiksi Pienentää aineiston kokoa Voi vääristää tuloksia, jos puuttuvat havainnot eivät jakaudu sattumanvaraisesti Mikko Mattila 005 3 Muuttujien hylkääminen analyysista Kannattaa harkita, jos muuttujassa suuri määrä puuttuvia havaintoja Ongelma, jos muuttuja tärkeä tutkimusongelman kannalta Mikko Mattila 005 4 Havaintojen parittainen poistaminen Voidaan käyttää jos analyysi perustuu kovarianssi- tai korrelaatiomatriisille Esim. regressio- tai faktorianalyysi Korrelaatiokertoimet lasketaan vain kaikista niistä havaintoyksiköistä, joista tiedot molemmista muuttujista Parempi vaihtoehto kuin kaikkien puuttuvien havaintojen poistaminen Keskiarvojen käyttö Korvataan puuttuvat havainnot muuttujan keskiarvolla Ei pienennä aineiston kokoa Pienentää keinotekoisesti muuttujien välisten yhteyksien vahvuutta (esim. korrelaatio) Mikko Mattila 005 5 Mikko Mattila 005 6 Ryhmäkeskiarvojen käyttö Korvataan puuttuvat havainnot ryhmien keskiarvoilla Esimerkiksi naisvastaajien puuttuvat havainnot korvataan naisvastaajien keskiarvolla jne. Lisää ryhmien samankaltaisuutta Vahvistaa keinotekoisesti muuttujien välisten yhteyksien vahvuutta (esim. Puuttuvien havaintojen koodaaminen Puuttuvat havainnot erotettava selkeästi oikeista muuttujien arvoista Usein käytetään koodeja 0, 9, 99 tai 999 Tärkeää määritellä tilasto-ohjelmalle puuttuvien havaintojen koodit korrelaatio) Mikko Mattila 005 7 Mikko Mattila 005 8 3

Keski- ja hajontaluvut Soveltuvan keskiluvun valinta Yhden muuttujan jakaumaa voidaan kuvailla: graafisilla menetelmillä, keskiluvuilla, ja hajontaluvuilla. Keskiluvut kuvaavat muuttuja arvojen keskimääräistä suuruutta Hajontaluvut kuvaavat muuttujan arvojen vaihtelun suuruutta Suhdeasteikko Keskiluku Muuttujan mittaustaso Luokitteluasteikko Järjestysasteikko Välimatkaasteikko Moodi X X X X Mediaani - X X X Aritmeettinen keskiarvo Geometrinen ja harmoninen keskiarvo - - X X - - - X Mikko Mattila 005 9 Mikko Mattila 005 0 Esimerkkiaineisto Moodi eli tyyppiarvo Työntekijän Sukupuoli Koulutus Lapsien määrä havaintonumero Työntekijä Mies Peruskoulu 0 Työntekijä Nainen Keskiaste 4 Työntekijä 3 Nainen Keskiaste Työntekijä 4 Mies Korkeakoulu Työntekijä 5 Nainen Keskiaste Työntekijä 6 Nainen Korkeakoulu Työntekijä 7 Nainen Korkeakoulu Työntekijä 8 Mies Peruskoulu 0 aineiston yleisin muuttujan arvo voidaan käyttää millä tahansa mittaustasoilla mitatulla muuttujalla esimerkkiaineistossa sukupuolen moodi on nainen ja lapsiluvun yksi moodeja voi olla useita: koulutusmuuttujan moodeja ovat keskiaste ja korkeakoulu Työntekijä 9 Mies Korkeakoulu 0 Työntekijä 0 Nainen Keskiaste Mikko Mattila 005 Mikko Mattila 005 Mediaani suuruusjärjestyksessä aineiston keskimmäisen havainnon arvo Kun muuttujia on parillinen määrä, mediaani on kumpikin keskimmäisistä luvuista (järjestysasteikko) tai kahden keskimmäisen luvun keskiarvo (välimatka- tai suhdeasteikko) Äärimmäisen poikkeavat arvot eivät yleensä vaikuta mediaaniin Lapsiluku: 0 0 0 4 Koulutus: P P KE KE KE KE KO KO KO KO Aritmeettinen keskiarvo Yleisin keskiluku Käytetään välimatka- tai suhdeasteikoilla Keskiarvo = havaintojen summa / havaintojen määrä Lapsimäärämuuttujan keskiarvo on (0+4++++++0+0+)/0=, Mikko Mattila 005 3 Mikko Mattila 005 4 4

Geometrinen ja harmoninen keskiarvo Soveltuvat suhdeasteikon muuttujille Harvoin käytettyjä Yleisin sovellusalue on indeksilaskenta ja kasvuilmiöiden analyysi Hajontaluvut Muuttujan mittaustaso Välimatka -asteikko Variaatiosuhde X X X X Vaihteluväli - X X X Luokitteluasteikko Järjestysasteikko Suhdeasteikko Hajontaluku Vaihteluvälin pituus - - X X Keskihajonta - - X X Variaatiokerroin - - X X Mikko Mattila 005 5 Mikko Mattila 005 6 Variaatiosuhde Käytetään lähinnä luokitteluasteikollisten muuttujien yhteydessä Kertoo, kuinka suuri osuus havainnoista sijoittuu muuttujan moodiluokkaan Kaava: v=-(havaintojen määrä moodiluokassa/havaintojen määrä) Vaihtelee nollan (ei hajontaa) ja yhden välillä (suuri hajonta) Sukupuolimuuttuja: v=-(6/0)=0,4 Vaihteluväli Sopii järjestys-, välimatka- ja suhdeasteikon muuttujille Ilmoittaa pienimmän ja suurimman arvon välin W=[x,x n ] Koulutus: W=[ peruskoulu, korkeakoulu ] Lapsiluku: W=[0,4] Mikko Mattila 005 7 Mikko Mattila 005 8 Vaihteluvälin pituus Sopii välimatka- ja suhdeasteikon muuttujille Ilmoittaa suurimman ja pienimmän arvon erotuksen w=x n -x Lapsiluku: w=4-0=4 Keskihajonta Sopii välimatka- ja suhdeasteikon muuttujille Kuvaa, kuinka kaukana yksittäiset havaintojen arvot ovat koko aineiston keskiarvosta n s = ( x i x ) n i= Varianssi on keskihajonnan neliö Mikko Mattila 005 9 Mikko Mattila 005 30 5

Lapsiluku 0 4 0 0 keskiarvo=, Lapsiluvun keskihajonta (x i -keskiarvo) -,.8 0.8 -. -. 0.8 (x i -keskiarvo).44 7.84 0.64.44.44 0.64 summa=3.6 3,6/0=,36 neliöjuuri,36:sta on noin,7 = keskihajonta Mikko Mattila 005 3 Variaatiokerroin Käytetään haluttaessa verrata kahden ryhmän keskihajontoja Suhteuttaa keskihajonnan keskiarvoon v = keskihajonta / keskiarvo Esim. palkkahajonta Suomessa ja Virossa Mikko Mattila 005 3 6