Survey ja kvantitatiiviset menetelmät Janne Matikainen Yliopistonlehtori
Käsitteet Survey = suunnitelmallinen kysely- tai haastattelututkimus Kvantitatiivinen eli määrällinen Mikä? Missä? Paljon? Kuinka usein? Suuri ja edustava otos Ilmiön kuvaus numeerisen tiedon pohjalta SPSS tilasto-ohjelma Kvantimot kannattaa tutustua
Tutkimusprosessin vaiheet 1. Tutkimusongelma 2. Tutkimussuunnitelma 3. Mahdolliset hypoteesit 4. Lomakkeen laadinta tai muu tiedonkeruu 5. Tietojen kerääminen 6. Tietojen analysointi 7. Raportointi
Otanta Perusjoukko liian suuri -> otanta Otos on edustava pienoiskuva perusjoukosta Otantamenetelmät Satunnaisotanta Systemaattinen otanta Ositettu otanta Ryväsotanta Otanta otosyksikön koon mukaan Otantaan vaikuttaa: perusjoukon heterogeenisyys, tulosten yksityiskohtaisuus, luottamustaso, virhemarginaali, kato
Kyselylomake Lomakkeella pitäisi saada vastauksia tutkimuskysymyksiin! Selkeä, sopivan mittainen, ymmärrettävä Kysymystyypit Avoimet kysymykset Suljetut kysymykset sekamuotoiset Asenneasteikot (Likert asteikko 1-5) Testaus Hyvä lomake mahdollistaa tulosten analysoinnin halutulla tavalla
Kyselylomakkeen saate mikä kysely/tutkimus, kuka tekee tutkimuksen tarpeellisuuden perustelu maininta tutkimustulosten ja -aineiston käytöstä sekä vastaajien anonymiteetin säilymisestä jokaisen vastaajan vastausten tarpeellisuus palautuspäivä (1-2 viikkoa) etukäteiskiitokset vastauksista/yhteistyöstä tekijän ja teettäjän edustajan nimet ja allekirjoitukset (opinnäytteissä usein työn ohjaajan nimi)
Muistutuksen saate mikä ja kenen tutkimus, milloin edellinen lähetys lähetettiin miksi lähetetään muistutus vastaamattomille hyvin näkyvä maininta siitä, että kyselyyn jo vastanneiden ei tarvitse enää vastata uudelleen vetoomus vastaamisen ja kyselyn onnistumisen puolesta vastausten viimeinen palautuspäivämäärä väljästi määriteltynä (esim. viikon kuluessa) mahdollisesti uudestaan tekijöiden ja teettäjien nimet ja allekirjoitukset; lisäksi mahdollisia uusia suosituksia ja suosittelijoita
Hyvä kysymys Yksi asia kerrallaan Ei liian pitkä, monimutkainen tai johdatteleva Kysymys on tarpeellinen tutkimuksen kannalta Yksiselitteinen, esim. Tietoja ei saa käyttää edelleen? kyllä/ei (kaksinkertainen kielto) Tuleeko talouteenne Aamulehti tai HS? Kyllä/ei (jokainen asia on kysyttävä erikseen) Kontrollikysymykset (suotavuuden ja myöntyvyyden ilmiöt)
Validiteetti ja reliabiliteetti Validiteetti eli pätevyys Mitataan oikeaa asiaa Systemaattisen virheen puuttuminen Etukäteisvalmistelujen merkitys Esim. älykkyyden tutkiminen Reliabiliteetti eli luotettavuus Tulosten tarkkuus Toistettavuuden oletus Otoksen edustavuus ja kato Cronbachin (alfa): mitä suurempi arvo, sitä yhtenäisempi mittari
Mitta-asteikot Tärkeää, koska analyysi riippuu käytetystä asteikosta Luokittelu- eli nominaaliasteikko: pelkät luokat, esim. kotipaikka ja siviilisääty Järjestys- eli ordinaaliasteikko: muuttujat voidaan laittaa järjestykseen, esim. mielipidemittaukset Välimatka- eli intervalliasteikko: muuttujien arvojen etäisyys tunnetaan, esim. syntymävuosi Suhdeasteikko eli absoluuttinen asteikko: kuten edellä, mutta tunnetaan nollakohta, esim. pituus, aika, tulot, asukasmäärä (voidaan mitata suhteita)
Aineiston syöttö Havaintomatriisi: taulukko, jossa vaakarivillä tilastoyksiköt ja pystysarakkeet muuttujia Yhdellä rivillä siis yhden tutkittavan tiedot Aineiston tarkistus: lomakkeen tiedot ja havaintomatriisi vastaavat toisiaan (esim. syntymävuosi/ikä) Uusien muuttujien määrittely Jatkuvien muuttujien määrittely (ikä, pituus, paino) Muuttujien yhdistäminen
Aineiston kuvailu Suora jakauma eli frekvenssijakauma: muuttujien yleisyys aineistossa Tunnusluvut: Keskiluvut: keskiarvo, moodi, mediaani Hajontaluvut: vaihteluväli, kvartiilit, keskihajonta Summamuuttujat: lasketaan yhteen samaa ilmiötä mittaavien muuttujien arvot
Lähde: http://www2.amk.fi/mater/tutkimusmenetelmat/kvantitat/kuvailu/tunnu.htm
Riippuvuuksien tarkastelu Korrelaatiokerroin Muuttujien yhteisvaihtelu Lähellä +1, voimakas korrelaatio Lähellä -1, voimakas negatiivinen korrelaatio 0, ei (lineaarista) riippuvuutta Korrelaatio ei takaa kausaali- eli syy-seuraussuhdetta! Ristiintaulukointi Tutkitaan muuttujien jakautumista ja niiden välisiä riippuvuuksia testausmenetelmä on ns. ² -testi ("khii-toiseen testi )
Taulukko 17: Väittämän "verkko lisää yksittäisen kansalaisen vaikutusmahdollisuuksia vastausten jakautuminen vastaajan aseman mukaan (khii^2-testinp-arvo 0,005). Vastaajan asema Samaa mieltä Eri mieltä Johto 15,2 % 58,4 % 16,0 % 9,1 % 1,3 % Asiantuntijat 23,8 % 49,6 % 18,1 % 7,1 % 1,3 % Avustavat tehtävätä 20,9 % 44,9 % 23,1 % 9,3 % 1,8 %
Merkitsevyystaso eli p-arvo Tulosteissa sig (significance) Ilmoittaa, kuinka suuri riski on, että saatu ero tai riippuvuus johtuu sattumasta p 0,001 tilastollisesti erittäin merkitsevä 0,001< p 0,01 tilastollisesti merkitsevä 0,01 < p 0,05 tilastollisesti melkein merkitsevä Myös sisällöllinen merkitsevyys!
Varsinainen analyysi Aineiston käsittely ei saisi jäädä pelkkään kuvailuun Analyysimenetelmien käyttö helppoa, mutta mutta Pitää tietää, mihin hakee vastauksia On osattava tulkita tuloksia
Selittäminen: regressioanalyysi Haetaan parasta mahdollista selittävien (riippumattomien) muuttujien yhdistelmää ennustettaessa yhtä selitettävää (riippuvaa) muuttujaa Esimerkiksi lehtien lukemista voidaan yrittää selittää iällä, asenteilla, koulutustasolla ns. regressiosuora Laskee: negatiivinen riippuvuus Nousee: positiivinen riippuvuus
Lähde:http://www.fsd.uta.fi/menetelmaopetus/regressio/analyysi.html
Monimuuttujamenetelmät Tarkastellaan yhtäaikaisesti useiden muuttujien välisiä yhteyksiä Pääkomponenttianalyysi Faktorianalyysi Etsitään uusia ns. piilomuuttujia eli faktoreita Tilasto-ohjelma etsii parhaiten korreloivat muuttujat Faktorien tulkinta! Ryhmittely- ei klusterianalyysi Havainnot luokitellaan ennalta tuntemattomiin ryhmiin
Tulosten esittäminen Taulukot ja kuviot havainnollistavat Pyri yksinkertaiseen esittämiseen Pelkistä olennaiseen, mutta muista olennainen Tekstissä viittaukset oikeisiin taulukoihin ja kuvioihin
Esimerkki: sisällön tuottamisen motiivit 526 vastaajaa Kysymyksiä 23 Ensin suorat jakaumat -> sirpaleista tietoa Faktorianalyysi -> kolme faktoria Faktorien pohjalta tehtiin uudet muuttujat eli summamuuttujat
Faktorit Verkon ja itsensä kehittäminen Opin verkossa uusia asioita (0.729) Verkkoon tuottamisessa on tärkeää itsenäisyys (eli voin päättää mitä ja mihin tuotan) (0.654) Yhteiset tavoitteet lisäävät intoa sisällön tuottamiseen verkkoon (0.633) Haluan tuottaa sisältöä, jos siitä on muille hyötyä tai iloa (0.632) Vastavuoroisuus on tärkeää (eli jos annan jotain verkkoon, niin myös saan sieltä jotain) (0.585) Osallistun mieluiten epäkaupallisiin yhteisöihin tai verkkopalveluihin (esim. Wikipedia, harrastusyhteisöt) (0.580) Tuottamalla materiaalia verkkoon voin hyödyntää sellaisia tietoja, taitoja tai kykyjä, joita en muuten käyttäisi (0.580)
Halu kertoa itsestä Haluan tulla kuuluisaksi verkossa (0.813) Haluan, että muut tietävät olemassaolostani verkossa (0.783) Haluan valokuvilleni verkossa mahdollisimman laajan yleisön (0.751) Haluan kertoa elämästäni verkossa (0.646) Haluan verkossa vaikuttaa toisiin ihmisiin ja muuttaa maailmaa (0.579) Internetissä syntyy uusia ilmiöitä, ja haluan olla niissä mukana (0.578) Sisällön jakaminen Verkossa julkaisemani valokuvat on suunnattu enimmäkseen ystävilleni (0.787) Minusta on kiinnostavaa lukea tai katsella tavallisten ihmisten tuottamaa materiaalia (kuvia, tekstiä) (0.518)
Sisällön tuottamisen motiivit Motiivi vahva kohtalainen heikko Yht. Itsensä ja verkon kehittäminen 59 35 6 100 Halu kertoa itsestä 8 21 71 100 Sisällön jakaminen 72 13 15 100
Sisällön tuottamisen motiivit ikäryhmittäin