TUTKIMUSAINEISTON ANALYYSI LTKY012 Timo Törmäkangas
LUENNOT Luento Paikka Vko Päivä Pvm Klo 1 L 304 8 Pe 21.2. 08:15-10:00 2 L 304 9 To 27.2. 12:15-14:00 3 L 304 9 Pe 28.2. 08:15-10:00 4 L 304 10 Ke 5.3. 12:15-14:00 5 L 304 11 Ke 12.3. 10:15-12:00 6 L 304 11 Pe 14.3. 08:15-10:00 7 L 304 12 Ma 17.3. 12:30-14:00 8 L 304 12 Ke 19.3. 12:15-14:00 9 L 304 13 Ti 25.3. 12:15-14:00 10 L 304 13 Ke 26.3. 10:15-12:00
HARJOITUKSET Harjoitusryhmien ajat ja paikat löytyvät Korpista Osallistuminen yhteen ryhmään Ryhmävaihtoja harjoituksen vetäjän suostumuksella
SUORITUS Luennon jälkeiset nettitestit Hyväksytty luentotentin suoritus Soveltavia tehtäviä 2-3 kpl (ks. verkkosivu) Tenttipäivät: 29.4. ja 12.5. Ilmoittaudu tenttiin Korpissa Printatut luentodiat saa ottaa tenttiin mukaan Laskin (EI KÄNNYKKÄ tms., jolla on puhelin-tai verkkoyhteyksiä tenttisalin ulkopuolelle) Hyväksytty suoritus: vähintään HYVÄT TIEDOT Harjoitukset: osallistuminen vähintään neljälle harjoituskerralle kuudesta
KURSSIN INTERNET-SIVU http://users.jyu.fi/~tatima/ter/luennot14.htm Luentomoniste (ei jaeta kurssilla) Tiedotteet Linkit Kysymyksiä ja vastauksia Lisämateriaalia / oheiskirjallisuutta Linkki löytyy myös Korpista
Lähde: http://opiskelijablogi.uta.fi/?tag=opiskelijaelama Motivaation tärkeys Lähde: http://collab0708.wikispaces.com/tiimi7_teema3
KURSSIN SISÄLTÖ Johdanto Mittaaminen ja aineiston hankinta Mitta-asteikot Otanta Aineiston esittäminen ja data-analyysi Havaintomatriisi Yksiulotteisen empiirisen jakauman esittäminen Frekvenssijakauma Luokittelu Kuviot Tunnusluvut Kaksiulotteisen jakauman esittäminen ja riippuvuus Ristiintaulukko ja kuviot Riippuvuuden tunnusluvut Vähän todennäköisyydestä Otantajakauma Tilastollinen päätöksenteko Estimointi Hypoteesien testaus Perustestejä Keskiarvotestit, varianssianalyysit Riippuvuuden testit
KVANTITATIIVINEN TUTKIMUS Kvantitatiivisessa tutkimuksessa tarkastellaan teoreettista mallia(engl. model) suhteessa kerättyyn aineistoon Esim. malli: parempi motivaatio johtaa keskimäärin korkeampiin arvosanoihin Malli-pohjaista tutkimusajattelua voi yksinkertaistaa seuraavasti: Teoria Operationalistaminen Empiirisen aineiston keruu ja analysointi Tulkinta Tutkimuksen tarkoitus on selvittää, onko empiirinen aineisto johdonmukainen teorian kanssa Erotus: Havaittu odotettu Hypoteettis-deduktiivinen lähestymistapa
Mallin tarkoitus on yleistää tarkasteltavan ilmiön piirteitä niin, että keskitytään vain ilmiöön olennaisesti vaikuttaviin tekijöihin Usein joudutaan tekemään oletuksia siitä, mitkä ovat huomionarvoisia tekijöitä Tulosten suhteellisuus: tulokset eivät absoluuttisia totuuksia, ehdollisia teorian pätevyydelle ja oletusten voimassaololle Tutkimuskysymysten toistettu tutkinta Jos samaa tutkimuskysymystä tutkitaan eri tutkittavilla (saman perusjoukon eri otokset) ja saadaan saman suuntaisia tuloksia, teorian pätevyydestä saadaan parempaa osoitusta
Yleisesti kvantitatiivisen tarkastelun kohteena on selvittää, mikä aiheuttaa eroa (tai samanlaisuutta) tutkittavien välillä: hajonta Tarkastellaan yksilöitä osana ryhmiä; tulokset koskevat ryhmiä, eivät niinkään yksittäisiä tutkittavia Erotellaan systemaattisen vaihtelun osuus satunnaisesta Keskeistä: yksilöiden väliset erot systemaattisten vaikutusten takia vs. satunnaisen vaikutuksen takia Esim. systemaattinen ero kävelynopeudessa intervention takia + satunnainen ero (muut tekijät, mittausvirheet jne.) Luodaan teoreettinen malli siitä, mitkä vaikutukset aiheuttavat systemaattisia eroja tutkittavien kesken Esim. kävelynopeus yli 70-vuotiailla on keskimäärin korkeampi miehillä kuin naisilla.
TILASTOLLISEN TUTKIMUKSEN KOHDE Millaisia ongelmia tilastollinen tutkimus tarkastelee? Tutkimuksen kohde on empiirinen, kvantitatiivinen ja toistuva Konkreettinen, aistein havaittava Numeeriseen tietoon liittyvä kohteesta saadaan mittalukuja, joita voidaan analysoida matemaattisesti Ilmiö koskettaa useampaa yksilöä (poikkileikkausasetelma) tai yhdestä yksilöstä voidaan tarkastella ilmiötä useammin kuin kerran (pitkittäisasetelma) Mikä on keskimääräinen tila? Onko kahden asian välillä riippuvuutta? Voidaanko ilmiön käyttäytymistä ennustaa tulevaisuudessa?
TILASTOTIEDE Tavoitteena kehittää menetelmiä, joilla voidaan analysoida eritavoin kerättyjä aineistoja testataan teoreettisia hypoteeseja lasketaan arvioita erilaisten vaikutusten suuruuksista määrittää erilaisten tapausten todennäköisyyksiä tehdä johtopäätöksiä Käytetään useiden tieteiden aputieteenä (väestötiede, taloustiede, lääketiede, yhteiskuntatieteet, arkielämä: esim. vakuutustoiminta, urheilutilastot, gallupit) Tutkijan työväline tiivis raportointiväline usein tieteellisesti perusteltu johtopäätösten teko
KVANTITATIIVISTEN MENETELMIEN HYVÄT JA HUONOT PUOLET Hyviä Tutkittava ilmiö saadaan eksaktin käsitejärjestelmän puitteisiin Ilmiöön liittyvä malli voidaan yksinkertaistaa Huonoja Kaikki ilmiöt eivät ole mitattavissa Tieto yksilön erityispiirteistä häviää
ESIMERKKI PÄÄTTELYSTÄ KVANTITATIIVISESSA TUTKIMUKSESSA Herra X haluaa selvittää, voiko hän saapua arkipäivänä bussipysäkille 5 minuuttia myöhemmin? Hän tarkkailee viikon ajan bussin lähtöaikoja. Bussin lähtöajaksi on merkitty 8:00, ja Herra X havaitsee seuraavat lähtöajat Ma 8:02 Ti 8:04 Ke 8:03 To 8:09 Pe 8:03 Herra X muuntaa aineisto siten, että hän tarkastelee minuuttimäärää yli klo 8:00
Keskimääräinen lähtöaika on 4.2 minuuttia (yli klo 8:00). Keskiarvoon vaikuttaa kuitenkin kovasti torstain poikkeuksellisen myöhäiseltä vaikuttava lähtöaika (8:09). (Täsmällisen) keskimääräisen lähtöajan perusteella herra X olisi siis myöhästynyt jokaisena aamuna, paitsi torstaina. Jos herra X ei halua myöhästyä bussista, hänen kannattaa keskiarvon sijasta tarkastella bussin aikaisinta lähtöaikaa (maanantain 2 minuuttia) ja mennä bussipysäkille ennen kuin kello on 8:02.
Herra X:n päätelmän käyttökelpoisuuteen vaikuttavat kuitenkin monet tekijät. Onko 2 minuuttia sittenkään varma päätös sille, ettei myöhästy bussista? Aineistossa yksikään havainto ei alita 2 min. Onko tämä vain sattumaa? Onko viikko tyypillinen? Ovatko tässä havaitut ajat poikkeuksellisen korkeita tai alhaisia? Onko lähtöaikojen vaihtelu todellisuudessa suurempaa? Ajaako linjaa sama kuljettaja vastaisuudessa? Oliko herra X:n kello viisarikello vai digitaalikello ja miten hän pyöristi minuutit?
YLEISTÄMISEN ONGELMIA Yhden aineiston analyysin pohjalta voidaan tehdä tilastollisia johtopäätöksiä, kun käytetään tilastotieteen matemaattisia menetelmiä Ongelmia ilmenee siinä vaiheessa, kun tuloksia yleistetään kattamaan laajempaa joukkoa Mallin ja kerätyn aineiston välillä voi olla liian suuria eroja, jotka johtavat harhapäätelmiin Huonon tilastomenetelmän valinta Oletusten huomiotta jättäminen Objektiivisuus: aineiston keruussa keskeistä ottaa huomioon se, että tutkija ei saisi vaikuttaa siihen, millaisia mittaustuloksia saadaan (puolueettomuus, eettisyys)
YLEISTÄMISEN ONGELMIA Ongelmia voidaan havaita tilastollisen päättelyketjun eri vaiheissa Onko teoria riittävän yleinen, mutta ei silti liian yksinkertainen? Puuttuuko mallista jotain tärkeää? Oliko mittarit tai mitattavat valittu oikein? Oliko ominaisuutta mitattu oikealla mittarilla? Oliko ongelmia mittauksessa? Jos käytettiin useampia mittaajia, mittasivatko he samalla tavalla? Oliko ongelmia aineiston käsittelyssä? Tallennettiinko aineisto oikein tietokoneelle? Tulkittiinko tuloksia oikein? Liioiteltiinko vähäisen tuloksen merkitystä? Oliko johtopäätös oikeutettu suhteessa tarkasteltujen tutkittavien määrään? Useisiin näistä ongelmista liittyy subjektiivisuutta ja riippuvaisuutta tieteenalan käytännöistä
http://www.hs.fi/politiikka/artikkeli/aamulehti+kansanedustajat+vaalikilpaan+aiempaa+pienemmin+rahasummin/1135263083599
http://www.hs.fi/verkkolehti/kotimaa/20110115/artikkeli/1135263059333
KURSSILLA KÄSITELTÄVIEN AIHEIDEN RAJAUKSIA Kokeelliset tutkimukset, epidemiologia, havaintotutkimukset (useimmat asetelmat) Yksinkertainen satunnaisotanta Ääretön / suuri perusjoukko Yksinkertaiset tutkimuskysymykset Pääasiassa poikkileikkaustutkimukset