TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas



Samankaltaiset tiedostot
TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI. LTKY012 Timo Törmäkangas Gerontologian tutkimuskeskus

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

r = n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit.

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op)

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu

Johdatus tilastotieteeseen Tilastollisten aineistojen kerääminen ja mittaaminen. TKK (c) Ilkka Mellin (2005) 1

Tilastollisten aineistojen kerääminen ja mittaaminen

MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op)

MONISTE 2 Kirjoittanut Elina Katainen

Mittaustekniikka (3 op)

Surveytutkimusksen Suunnittelu ja Teoreettisten Konstruktioiden Validointi. Seppo Pynnönen Vaasan yliopisto Menetelmätieteiden laitos

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Populaatio tutkimusobjektien muodostama joukko, johon tilastollinen tutkimus kohdistuu, koko N

Matemaatikot ja tilastotieteilijät

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Luento-osuusosuus. tilasto-ohjelmistoaohjelmistoa

Harjoitus 7: NCSS - Tilastollinen analyysi

Otannasta ja mittaamisesta

Kvantitatiivisen aineiston analyysi

MTTTP1 Tilastotieteen johdantokurssi Luento JOHDANTO

MTTTP1, luento KERTAUSTA

b6) samaan perusjoukkoon kohdistuu samanaikaisesti useampia tutkimuksia.

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Mittaaminen menettely (sääntö), jolla tilastoyksikköön liitetään tiettyä ominaisuutta kuvaava luku, mittaluku.

1. Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet

Yhteistyöaineiden edustajan puheenvuoro

Laadullinen tutkimus. KTT Riku Oksman

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Luento KERTAUSTA Kaksiulotteinen jakauma Pisteparvi, Toyota Avensis -farmariautoja

Tilastollisten aineistojen kerääminen ja mittaaminen. Tilastollisten aineistojen kerääminen ja mittaaminen

Sovellettu todennäköisyyslaskenta B

Johdatus tilastotieteeseen Tilastollisten aineistojen kerääminen ja mittaaminen. TKK (c) Ilkka Mellin (2004) 1

Tutkimuksellinen vai toiminnallinen opinnäytetyö

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Luentokalvoja tilastollisesta päättelystä. Kalvot laatinut Aki Taanila Päivitetty

pitkittäisaineistoissa

Psykologia tieteenä. tieteiden jaottelu: TIETEET. EMPIIRISET TIETEET tieteellisyys on havaintojen (kr. empeiria) tekemistä ja niiden koettelua

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1

OPETUSSUUNNITELMALOMAKE

OPETUSSUUNNITELMALOMAKE

Mat Tilastollisen analyysin perusteet, kevät 2007

Näistä standardoiduista arvoista laskettu keskiarvo on nolla ja varianssi 1, näin on standardoidulle muuttujalle aina.

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?

MTTTP1, luento KERTAUSTA

pitkittäisaineistoissa

MTTTP1, luento KERTAUSTA

Näistä standardoiduista arvoista laskettu keskiarvo on nolla ja varianssi 1, näin on standardoidulle muuttujalle aina.

Hypermedian jatko-opintoseminaari

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Mittaamisen maailmasta muutamia asioita. Heli Valkeinen, erikoistutkija, TtT TOIMIA-verkoston koordinaattori

ABHELSINKI UNIVERSITY OF TECHNOLOGY

Mitä tarvitsee tietää biostatistiikasta ja miksi? Matti Uhari Lastentautien klinikka Oulun yliopisto

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-C2128 Ennustaminen ja Aikasarja-analyysi, 5 op Esittely

Ohjeita kvantitatiiviseen tutkimukseen

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

HAVAITUT JA ODOTETUT FREKVENSSIT

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012

805306A Johdatus monimuuttujamenetelmiin, 5 op

Testit järjestysasteikollisille muuttujille

Kvantitatiiviset tutkimusmenetelmät maantieteessä

Johdatus tn-laskentaan perjantai

TASAVIRTAPIIRI - VASTAUSLOMAKE

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Testejä suhdeasteikollisille muuttujille

KVANTITATIIVISET TUTKIMUSMENETELMÄT MAANTIETEESSÄ

1.Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet

Mat Operaatiotutkimuksen projektityöseminaari

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

Tilastollisen analyysin perusteet Luento 11: Epäparametrinen vastine ANOVAlle

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012

KURSSIKYSELYAINEISTO: HUOM! Aineiston tilastoyksikkömäärä 11 on kovin pieni oikean tilastotieteen tekemiseen, mutta Harjoitteluun se kelpaa kyllä!

Sovellettu todennäköisyyslaskenta B

Aineistoista. Laadulliset menetelmät: miksi tarpeen? Haastattelut, fokusryhmät, havainnointi, historiantutkimus, miksei videointikin

NÄYTÖN ARVIOINTI: SYSTEMAATTINEN KIRJALLISUUSKATSAUS JA META-ANALYYSI. EHL Starck Susanna & EHL Palo Katri Vaasan kaupunki 22.9.

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin

Teema 8: Parametrien estimointi ja luottamusvälit

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit

MTTTP1, luento KERTAUSTA JA TÄYDENNYSTÄ. Tunnusluvut. 1) Sijainnin tunnuslukuja. Keskilukuja moodi (Mo) mediaani (Md) keskiarvo, kaava (1)

1. Tilastollinen malli??

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Testit laatueroasteikollisille muuttujille

Mat Tilastollisen analyysin perusteet, kevät 2007

Transkriptio:

TUTKIMUSAINEISTON ANALYYSI LTKY012 Timo Törmäkangas

LUENNOT Luento Paikka Vko Päivä Pvm Klo 1 L 304 8 Pe 21.2. 08:15-10:00 2 L 304 9 To 27.2. 12:15-14:00 3 L 304 9 Pe 28.2. 08:15-10:00 4 L 304 10 Ke 5.3. 12:15-14:00 5 L 304 11 Ke 12.3. 10:15-12:00 6 L 304 11 Pe 14.3. 08:15-10:00 7 L 304 12 Ma 17.3. 12:30-14:00 8 L 304 12 Ke 19.3. 12:15-14:00 9 L 304 13 Ti 25.3. 12:15-14:00 10 L 304 13 Ke 26.3. 10:15-12:00

HARJOITUKSET Harjoitusryhmien ajat ja paikat löytyvät Korpista Osallistuminen yhteen ryhmään Ryhmävaihtoja harjoituksen vetäjän suostumuksella

SUORITUS Luennon jälkeiset nettitestit Hyväksytty luentotentin suoritus Soveltavia tehtäviä 2-3 kpl (ks. verkkosivu) Tenttipäivät: 29.4. ja 12.5. Ilmoittaudu tenttiin Korpissa Printatut luentodiat saa ottaa tenttiin mukaan Laskin (EI KÄNNYKKÄ tms., jolla on puhelin-tai verkkoyhteyksiä tenttisalin ulkopuolelle) Hyväksytty suoritus: vähintään HYVÄT TIEDOT Harjoitukset: osallistuminen vähintään neljälle harjoituskerralle kuudesta

KURSSIN INTERNET-SIVU http://users.jyu.fi/~tatima/ter/luennot14.htm Luentomoniste (ei jaeta kurssilla) Tiedotteet Linkit Kysymyksiä ja vastauksia Lisämateriaalia / oheiskirjallisuutta Linkki löytyy myös Korpista

Lähde: http://opiskelijablogi.uta.fi/?tag=opiskelijaelama Motivaation tärkeys Lähde: http://collab0708.wikispaces.com/tiimi7_teema3

KURSSIN SISÄLTÖ Johdanto Mittaaminen ja aineiston hankinta Mitta-asteikot Otanta Aineiston esittäminen ja data-analyysi Havaintomatriisi Yksiulotteisen empiirisen jakauman esittäminen Frekvenssijakauma Luokittelu Kuviot Tunnusluvut Kaksiulotteisen jakauman esittäminen ja riippuvuus Ristiintaulukko ja kuviot Riippuvuuden tunnusluvut Vähän todennäköisyydestä Otantajakauma Tilastollinen päätöksenteko Estimointi Hypoteesien testaus Perustestejä Keskiarvotestit, varianssianalyysit Riippuvuuden testit

KVANTITATIIVINEN TUTKIMUS Kvantitatiivisessa tutkimuksessa tarkastellaan teoreettista mallia(engl. model) suhteessa kerättyyn aineistoon Esim. malli: parempi motivaatio johtaa keskimäärin korkeampiin arvosanoihin Malli-pohjaista tutkimusajattelua voi yksinkertaistaa seuraavasti: Teoria Operationalistaminen Empiirisen aineiston keruu ja analysointi Tulkinta Tutkimuksen tarkoitus on selvittää, onko empiirinen aineisto johdonmukainen teorian kanssa Erotus: Havaittu odotettu Hypoteettis-deduktiivinen lähestymistapa

Mallin tarkoitus on yleistää tarkasteltavan ilmiön piirteitä niin, että keskitytään vain ilmiöön olennaisesti vaikuttaviin tekijöihin Usein joudutaan tekemään oletuksia siitä, mitkä ovat huomionarvoisia tekijöitä Tulosten suhteellisuus: tulokset eivät absoluuttisia totuuksia, ehdollisia teorian pätevyydelle ja oletusten voimassaololle Tutkimuskysymysten toistettu tutkinta Jos samaa tutkimuskysymystä tutkitaan eri tutkittavilla (saman perusjoukon eri otokset) ja saadaan saman suuntaisia tuloksia, teorian pätevyydestä saadaan parempaa osoitusta

Yleisesti kvantitatiivisen tarkastelun kohteena on selvittää, mikä aiheuttaa eroa (tai samanlaisuutta) tutkittavien välillä: hajonta Tarkastellaan yksilöitä osana ryhmiä; tulokset koskevat ryhmiä, eivät niinkään yksittäisiä tutkittavia Erotellaan systemaattisen vaihtelun osuus satunnaisesta Keskeistä: yksilöiden väliset erot systemaattisten vaikutusten takia vs. satunnaisen vaikutuksen takia Esim. systemaattinen ero kävelynopeudessa intervention takia + satunnainen ero (muut tekijät, mittausvirheet jne.) Luodaan teoreettinen malli siitä, mitkä vaikutukset aiheuttavat systemaattisia eroja tutkittavien kesken Esim. kävelynopeus yli 70-vuotiailla on keskimäärin korkeampi miehillä kuin naisilla.

TILASTOLLISEN TUTKIMUKSEN KOHDE Millaisia ongelmia tilastollinen tutkimus tarkastelee? Tutkimuksen kohde on empiirinen, kvantitatiivinen ja toistuva Konkreettinen, aistein havaittava Numeeriseen tietoon liittyvä kohteesta saadaan mittalukuja, joita voidaan analysoida matemaattisesti Ilmiö koskettaa useampaa yksilöä (poikkileikkausasetelma) tai yhdestä yksilöstä voidaan tarkastella ilmiötä useammin kuin kerran (pitkittäisasetelma) Mikä on keskimääräinen tila? Onko kahden asian välillä riippuvuutta? Voidaanko ilmiön käyttäytymistä ennustaa tulevaisuudessa?

TILASTOTIEDE Tavoitteena kehittää menetelmiä, joilla voidaan analysoida eritavoin kerättyjä aineistoja testataan teoreettisia hypoteeseja lasketaan arvioita erilaisten vaikutusten suuruuksista määrittää erilaisten tapausten todennäköisyyksiä tehdä johtopäätöksiä Käytetään useiden tieteiden aputieteenä (väestötiede, taloustiede, lääketiede, yhteiskuntatieteet, arkielämä: esim. vakuutustoiminta, urheilutilastot, gallupit) Tutkijan työväline tiivis raportointiväline usein tieteellisesti perusteltu johtopäätösten teko

KVANTITATIIVISTEN MENETELMIEN HYVÄT JA HUONOT PUOLET Hyviä Tutkittava ilmiö saadaan eksaktin käsitejärjestelmän puitteisiin Ilmiöön liittyvä malli voidaan yksinkertaistaa Huonoja Kaikki ilmiöt eivät ole mitattavissa Tieto yksilön erityispiirteistä häviää

ESIMERKKI PÄÄTTELYSTÄ KVANTITATIIVISESSA TUTKIMUKSESSA Herra X haluaa selvittää, voiko hän saapua arkipäivänä bussipysäkille 5 minuuttia myöhemmin? Hän tarkkailee viikon ajan bussin lähtöaikoja. Bussin lähtöajaksi on merkitty 8:00, ja Herra X havaitsee seuraavat lähtöajat Ma 8:02 Ti 8:04 Ke 8:03 To 8:09 Pe 8:03 Herra X muuntaa aineisto siten, että hän tarkastelee minuuttimäärää yli klo 8:00

Keskimääräinen lähtöaika on 4.2 minuuttia (yli klo 8:00). Keskiarvoon vaikuttaa kuitenkin kovasti torstain poikkeuksellisen myöhäiseltä vaikuttava lähtöaika (8:09). (Täsmällisen) keskimääräisen lähtöajan perusteella herra X olisi siis myöhästynyt jokaisena aamuna, paitsi torstaina. Jos herra X ei halua myöhästyä bussista, hänen kannattaa keskiarvon sijasta tarkastella bussin aikaisinta lähtöaikaa (maanantain 2 minuuttia) ja mennä bussipysäkille ennen kuin kello on 8:02.

Herra X:n päätelmän käyttökelpoisuuteen vaikuttavat kuitenkin monet tekijät. Onko 2 minuuttia sittenkään varma päätös sille, ettei myöhästy bussista? Aineistossa yksikään havainto ei alita 2 min. Onko tämä vain sattumaa? Onko viikko tyypillinen? Ovatko tässä havaitut ajat poikkeuksellisen korkeita tai alhaisia? Onko lähtöaikojen vaihtelu todellisuudessa suurempaa? Ajaako linjaa sama kuljettaja vastaisuudessa? Oliko herra X:n kello viisarikello vai digitaalikello ja miten hän pyöristi minuutit?

YLEISTÄMISEN ONGELMIA Yhden aineiston analyysin pohjalta voidaan tehdä tilastollisia johtopäätöksiä, kun käytetään tilastotieteen matemaattisia menetelmiä Ongelmia ilmenee siinä vaiheessa, kun tuloksia yleistetään kattamaan laajempaa joukkoa Mallin ja kerätyn aineiston välillä voi olla liian suuria eroja, jotka johtavat harhapäätelmiin Huonon tilastomenetelmän valinta Oletusten huomiotta jättäminen Objektiivisuus: aineiston keruussa keskeistä ottaa huomioon se, että tutkija ei saisi vaikuttaa siihen, millaisia mittaustuloksia saadaan (puolueettomuus, eettisyys)

YLEISTÄMISEN ONGELMIA Ongelmia voidaan havaita tilastollisen päättelyketjun eri vaiheissa Onko teoria riittävän yleinen, mutta ei silti liian yksinkertainen? Puuttuuko mallista jotain tärkeää? Oliko mittarit tai mitattavat valittu oikein? Oliko ominaisuutta mitattu oikealla mittarilla? Oliko ongelmia mittauksessa? Jos käytettiin useampia mittaajia, mittasivatko he samalla tavalla? Oliko ongelmia aineiston käsittelyssä? Tallennettiinko aineisto oikein tietokoneelle? Tulkittiinko tuloksia oikein? Liioiteltiinko vähäisen tuloksen merkitystä? Oliko johtopäätös oikeutettu suhteessa tarkasteltujen tutkittavien määrään? Useisiin näistä ongelmista liittyy subjektiivisuutta ja riippuvaisuutta tieteenalan käytännöistä

http://www.hs.fi/politiikka/artikkeli/aamulehti+kansanedustajat+vaalikilpaan+aiempaa+pienemmin+rahasummin/1135263083599

http://www.hs.fi/verkkolehti/kotimaa/20110115/artikkeli/1135263059333

KURSSILLA KÄSITELTÄVIEN AIHEIDEN RAJAUKSIA Kokeelliset tutkimukset, epidemiologia, havaintotutkimukset (useimmat asetelmat) Yksinkertainen satunnaisotanta Ääretön / suuri perusjoukko Yksinkertaiset tutkimuskysymykset Pääasiassa poikkileikkaustutkimukset