Kvantitatiiviset tutkimusmenetelmät Henrik Räsänen tekniikan tohtori kauppatieteiden lisensiaatti
Induktio ja deduktio Lait ja teoriat Tarkastelun kautta hankitut faktat Selitykset ja ennusteet Dr Henrik Räsänen, HAMK 2
Mittauksen määritteleminen Oletetaan, että aiomme mitata jotain todellisuuden näkökulmaa, esimerkiksi kilpailukykyä. Edessä olevaa tehtävää kuvataan seuraavassa kuviossa. Ensin tarvitaan hyvä käsitteellinen määritelmä mitattavasta näkökannasta X. Seuraavaksi tarvitaan sääntö, joka määrittelee, miten sijoittaa numeroita määrättyihin empiirisiin ominaisuuksiin. Näin ollen, mittauksilla kartoitamme joitain empiirisen maailman näkökantoja. Dr Henrik Räsänen, HAMK 3
Mittaus käsitteellisten ja empiiristen tasojen välinen linkki Käsitteellinen X TASO Empiirinen X Dr Henrik Räsänen, HAMK 4
Objektit, ominaisuudet ja indikaattorit Emme mittaa objekteja tai ilmiöitä sinällään, vaan ennemminkin mittaamme objektien ja ilmiöiden määrättyjä ominaisuuksia. Tällaisten ominaisuuksien kartoittamiseen käytämme indikaattoreita, eli operatiivisia määritelmiämme käyttäen hankittuja tuloksia, esimerkiksi kyselyn vastauksia. (ks. seur. kuvio). Dr Henrik Räsänen, HAMK 5
Objekti/ilmiö, ominaisuudet ja indikaattori Objekti/ilmiö Ominaisuudet Indikaattorit Dr Henrik Räsänen, HAMK 6
Mitta-asteikot kvantitatiivisessa tutkimuksessa Asteikko Perus empiiriset operaatiot Nominaali Yhtäläisyyden määräytyminen Ordinaali Suuremman tai pienemmän määräytyminen Tyypillinen käyttö Jaottelu: - Mies-Nainen - Ammatit - Yhteiskuntaluokka Sijoitus: - Preferenssitieto - Asenneanalyysi Keskiarvojen mittaukset Mediaani Mediaani Intervalli Yhtäläisyyden tai välimatkan määräytyminen Indeksiluvut: - Lämpötila-asteikot Keskiarvo Suhde Yhtäläisyys tai suhde Myynti Toimitetut yksiköt Asiakkaiden määrä Keskiarvo Dr Henrik Räsänen, HAMK 7
Validiteetti ja luotettavuus mittauksissa Kun mittaamme jotain, haluamme valideja mittauksia, eli mittauksia, jotka osoittavat sen, mitä niiden tulisikin. Mittauksissa on kuitenkin usein virheitä. Havainnoitu mittaustulos saattaa heijastaa oikeata tulosta, mutta voi heijastaa myös muita tekijöitä, kuten esimerkiksi: 1. Vakaita ominaisuuksia. Dr Henrik Räsänen, HAMK 8
Validiteetti ja luotettavuus mittauksissa 2. Myös hetkelliset, henkilökohtaiset tekijät, kuten esimerkiksi mieliala, saattavat vaikuttaa vastaukseen. 3. Muita vastauksiin mahdollisesti vaikuttavia tekijöitä ovat tilannetekijät, esimerkiksi ajan aiheuttama paine, mittauksen hallinnoinnissa tapahtuvat vaihtelut, sekä mekaaniset tekijät, esimerkiksi tarkistusmerkki väärässä laatikossa tai väärin koodatut vastaukset. Dr Henrik Räsänen, HAMK 9
Rakenne (construct) validiteetti Rakenne (construct) validiteetti voidaan määritellä suuruudeksi, jolla määrällä operationalisaatio mittaa sitä käsitettä, jota sen on määrä mitata ( tiedon oikeellisuus). Rakennevaliditeetti on välttämätön merkityksellisille ja tulkittaville tutkimustuloksille ja voidaan määrittää erilaisin tavoin. 1. Nimellis (face) validiteetti kertoo, mihin laajuuteen asti käytetty mittaus on järkevä mittaus. Yksinkertainen koe nimellisvaliditeetista on kysyä mielipidettä toiselta aiheeseen tutustuneelta. Dr Henrik Räsänen, HAMK 10
Rakennevaliditeetti 2. Konvergentti (convergent) validiteetti kertoo missä määrin useat mittaukset ja/tai useat metodit saman asian mittauksessa tuottavat vertailukelpoisia tuloksia. Korrelaatiotekniikoita käytetään usein arvioimaan lähentyvää konvergenttivaliditeettia. 3. Divergentti (divergent) validiteetti kertoo, mihin laajuuteen asti rakenne on erotettavissa toisesta rakenteesta. Jos tutkija mittaa esimerkiksi innovatiivisuutta, hänen tulee olla varma siitä ettei hän mittaa jotain toista rakennetta, esimerkiksi organisaatioresursseja. Dr Henrik Räsänen, HAMK 11
Muita validiteetin muotoja Sisäinen (internal) validiteetti Sisäinen validiteetti viittaa laajuuteen, josta voimme päätellä että kahden (tai useamman) muuttujan välillä on kausaalinen suhde. Tilastollinen (statistical conclusion) johtopäätösvaliditeetti Kausaalista suhdetta (co-variation) todistettaessa suhteen pitää olla myös tilastollisesti merkittävä. Näin ollen tilastollinen johtopäätösvaliditeetti on edellytys kausaalisista suhteista tehdyille päätelmille. Dr Henrik Räsänen, HAMK 12
Muita validiteetin muotoja Ulkoinen (external) validiteetti Ulkoinen validiteetti kertoo, mihin laajuuteen löydökset voidaan yleistää tiettyihin ihmisiin, asetelmiin ja aikoihin, ja myös ihmistyyppien, asetelmien ja aikojen välillä. Dr Henrik Räsänen, HAMK 13
Tiedonkeruu
Kvalitatiivisten ja kvantitatiivisten menetelmien painotuksen ero Kvalitatiiviset menetelmät Kvantitatiiviset menetelmät -Painotus ymmärtämisessä -Painotus kokeilemisessa ja todentamisessa -Painotus vastaajan näkökannan -Keskittyminen faktoissa ja sosiaalisten ymmärtämisessä tilanteiden syissä - Tulkinta ja rationaalinen lähestyminen -Looginen ja kriittinen lähestymistapa -Havainnot ja mittaukset -Kontrolloitu mittaus luonnollisissa asetuksissa -Subjektiivinen sisäpiirin näkökulma -Objektiivinen ulkopuolen näkökulma tiedon läheisyys etäällä tiedosta -Tutkiva suuntautuminen -Hypoteettinen- deduktiivinen; keskittyminen hypoteesitestauksessa -Prosessisuuntautuminen -Tulossuuntautuminen -Holistinen näkökanta -Tarkka ja analyyttinen -Yleistys yksilöllisen organismin -Populaation kautta tapahtuva ominaisuuksien ja sisällön kautta yleistäminen tapahtuva yleistäminen Dr Henrik Räsänen, HAMK 15
Kommunikaatio Tiedonkeruuseen tämän lähteen kautta on kolme tapaa: postitutkimus henkilökohtainen haastattelu puhelinhaastattelu. Yleisimmin käytetty ensisijainen tiedonkeruumenetelmä on kommunikaation kautta. Dr Henrik Räsänen, HAMK 16
Kommunikaatio Monet opiskelijat ja liiketoiminnan alalla toimivat tutkijat keräävät tietonsa selvitysten tai haastattelujen kautta. Tässä tapauksessa ensimmäinen kysymys on, kuinka jäsenneltyjä tai standardisoituja kysymysten tulisi olla. Useimmissa jäsennellyissä kyselyissä, joko selvityksessä tai haastattelussa kysymykset ja vastaukset ovat ennalta määrättyjä. Dr Henrik Räsänen, HAMK 17
Kommunikaatio Jäsentelemättömissä kyselyissä tai haastatteluissa kysymykset ovat vain karkeasti ennalta määrättyjä. Sen lisäksi ei ole ennalta määrättyjä vastauksia. Kysely, missä kysymykset ovat ennalta määrättyjä, mutta vastaajat voivat käyttää omia sanojaan ja tapojaan vastata, on puoliijäsennelty kysely, jota käytetään yleensä tutkimuksessa ja haastattelussa. Dr Henrik Räsänen, HAMK 18
Kommunikaatio Kyselyn ja haastattelun selkein eroavaisuus on hinta. Erittäin suurelle tutkimukselle on hankalaa ja kallista haastatella satoja vastaajia. Sen lisäksi haastattelija tarvitsee paljon harjoitusta, varsinkin jos kyseessä on joku muu kuin tutkija. Dr Henrik Räsänen, HAMK 19
Kommunikaatio Kyselytutkimus ei aiheuta tälläisiä ongelmia. Haastattelu on toisaalta joustavampi menetelmä kuin kysely. Haastatteluja pidetään sopivampina kvalitatiivisiin tutkimuksiin, kun taas kyselyt ovat sopivampia kvantitatiiviseen tutkimusmetodologiaan. Dr Henrik Räsänen, HAMK 20
Kyselytutkimukset Tutkimukset viittaavat tiedonkeruumenetelmään, joka hyödyntää kyselyitä tai haastattelutekniikoita vastaajien suullisen käytöksen tallentamiseen. Tutkimus on tehokas työkalu mielipiteiden, asenteiden ja kuvausten saamiseen sekä syy-vaikutus suhteiden hankkimiseen. Dr Henrik Räsänen, HAMK 21
Kyselytutkimukset On kuitenkin useita olosuhteita, jotka saattavat vaikuttaa vastaajiin ja heidän reaktioihinsa, kuten myös heidän vastauksiinsa. Tekijöitä, jotka vaikuttavat vastaajiin: Sponsori: kun tutkimus on rahoitettu tai sponsoroitu tietyn organisaation toimesta, saattaa se johtaa epäluuloihin ja estää vastaajia vastaamasta kysymyksiin oikein. Vetoomus: kun tutkija tekee vetoomuksen, miksi ja kuinka tärkeätä hänen on saada vastauksia kysymyksiinsä ja miten se voi olla hyödyllistä vastaajalle/yhteiskunnalle jolle käsillä oleva tutkimus tehdään. Virike: kun jonkinlainen palkkio annetaan vastaajille. Tässä on tehtävä päätös, tulisiko palkkion olla taloudellinen vai ei-taloudellinen. Dr Henrik Räsänen, HAMK 22
Kyselytutkimukset Kyselyformaatti: ulkomuodolla, asettelulla, pituudella ja jopa paperin värillä oli ennen vaikutus siihen, vastattiinko kyselyyn kunnolla vai ei. Saatekirje: sen sävyllä ja asenteella on valtava vaikutus vastaajaan. Frankeerattu ja omalla nimellä varustettu kirjekuori: jotta vastaajalle ei aiheudu kuluja, ja että vastaajan olisi helpompaa tai sopivampaa lähettää vastaukset takaisin. Seuranta: sopivan kiitoskirjeen lähettäminen vastaajille ja, jos he niin haluavat, tutkimuksen tulosten lähettämisen heille heti valmistumisen jälkeen. Dr Henrik Räsänen, HAMK 23
Kyselytutkimukset Tutkimukset ja kyselyt ovat suosituimpien tiedonkeruumenetelmien joukossa kaupallisen alan tutkimuksissa, ja kyselyiden päätyypit ovat kuvaava ja/tai analyyttinen. Kun tutkimusongelma on laadittu ja tutkimuksen tarkoitus on selkeästi määritelty, määrätään tutkimuksen tyyppi valitaanko analyyttinen vai kuvaava. Erilaiset tutkimukset johtavat erityyppisiin ongelmiin ja vaativat erilaista suunnittelua ja käsittelyä. Dr Henrik Räsänen, HAMK 24
Kyselytutkimukset Analyyttiset tutkimukset Analyyttisillä kyselytutkimuksilla voimme testata teoriaa viemällä saman logiikan kentälle: esimerkiksi, ymmärtämään laskentatoimen hallintosysteemien ja liiketoimintastrategian suhdetta. Näin ollen, tämän tyylisessä tutkimuksessa joudumme korostamaan riippumattomien, riippuvien ja epäolennaisten muuttujien täsmentämistä. Dr Henrik Räsänen, HAMK 25
Kyselytutkimukset Analyyttiset tutkimukset Meidän tulee myös huomioida asiaankuuluva hyöty olemassa olevasta kirjallisuudesta, teoriasta ja tutkimuksista, samalla käsitteellistäen ja rakentaen tutkimustamme. Analyyttisissä tutkimuksissa riippumattomia, riippuvaisia ja asiaankuulumattomia muuttujia hallitaan tilastollisten tekniikoiden, kuten monimuuttujaregression kautta. Tällaisiin tutkimuksiin sisältyvät kysymykset ja muuttujat näin ollen vaativat harkittua käsitteellistämistä ja arviointiasteikkoa. Dr Henrik Räsänen, HAMK 26
Kyselytutkimukset Kuvailevat tutkimukset Kuvailevat tutkimukset ovat tekemisissä ilmiön tunnistamisen kanssa, jonka vaihtelevaisuutta haluamme kuvata. Tutkimus on tekemisissä määritellyn kohteiden populaation tiettyjen ominaisuuksien kanssa, joko määritellyssä ajassa tai vaihtelevissa ajoissa vertailtavien tarkoitusten vuoksi. Tässä polttopisteenä on enemmänkin asiaankuuluvan populaation edustavassa otoksessa kuin analyyttisessä suunnitelmassa, sillä olemme ensisijaisesti tekemisissä löydösten tarkkuuden kanssa sekä sen, voidaanko niitä yleistää. Jopa näissä tutkimuksissa edellisten tutkimusten ja kirjallisuuden tarkastelu on tärkeää, jotta voidaan määritellä, millaisia kysymyksiä kyselyyn tulisi sisällyttää. Dr Henrik Räsänen, HAMK 27
Kyselytutkimuksen suunnittelu Käsitteellistä ja jäsennä tutkimusongelma. 1. Pohdi tutkimuksen tavoitteita 2. Arvioi tietoisuuden nykyinen tila 3. Arvioi käytössä olevat erilaiset resurssit Analyyttinen tutkimus? Tunnista riippumattomat, riippuvaiset ja asiaankuulumattomat muuttujat Kuvaava tutkimus? Tunnista ilmiö, jonka vaihtelevaisuutta haluat kuvata Määritä otantastrategia määrittelemällä otantakoko ja suunnittelemalla keinot edustavan (sattumanvaraisen) otannan saavuttamiseksi. Onko tieto kerätty yhden lähestymistavan kautta vastaajille? Vai vaatiiko tutkimusongelman luonne yksittäisen otoksen toistettua kontaktia vai useita vastaavia otoksia? Valvottu haastattelu VAI Vastaajan täyttämä/ Kyselylomake/aikataulu Postitse valvottu kysely Dr Henrik Räsänen, HAMK 28
Kyselytutkimukset Edellinen kuvio havainnollistaa, että analyyttiset sekä kuvaavat tutkimukset ovat tekemisissä populaation (tutkimuksen kohde) tunnistamisen kanssa. Populaatio tarjoaa kaikki vastaukset, jotka auttavat vastaamaan tutkimuskysymyksiin. Tästä populaatiosta tulisi ottaa edustava otanta. Tutkimusongelma ja päämäärät sanelevat myös, tuleeko tiedot kerätä yhdellä lähestymisellä, vai tuleeko otantaan ottaa yhteyttä uudelleen ja uudelleen. Kummassakin tapauksessa täytyy harkita käytännöllisyyttä ja lähestymistapaa ennen kyselylomakkeen ja aikataulun laatimista. Dr Henrik Räsänen, HAMK 29
Kyselytutkimukset Tärkein asia on tietää, mitä informaatiota haluamme saada. Sekä kuvaavat että kausaaliset tutkimukset vaativat a priorioletuksia ja olettamuksia. Tämä ohjaa kysymyksiämme, millaista informaatiota tarvitsemme ja kenen tulisi olla vastaaja. Lopulta pitää päättää, lähetetäänkö kysely postissa ja odotetaan vastauksia vai haastatellaanko vastaajia kasvokkain tai puhelimella. Tällöin ei pelkästään tutkimusongelma ja päämäärät, vaan myös esimerkiksi otoskoon sijainti, rahoituksen saatavuus ja informaation monimutkaisuus vaikuttavat menettelyyn ja aikatauluun. Dr Henrik Räsänen, HAMK 30
Kysymyslomakkeen valmistelu Kysymyslomakkeen valmistelun ensimmäinen askel on halutun informaation määritteleminen. Seuraavaksi pitää harkita, tehdäänkö kysely peitettynä vai avoimena. Sen lisäksi pitää päättää, miten se suoritetaan; postin kautta, henkilökohtainen haastattelu, puhelinhaastattelu vai yhdistelmä. Dr Henrik Räsänen, HAMK 31
Kysymyslomakkeen valmistelu Kolmantena pitää tarkastella yksilöllisten kysymysten valmistelua (yksinkertaisuus, kysyttyjen asioiden arkaluontoisuus, vastaajien halukkuus ja kyvykkyys vastaamiseen, jne.) Neljäntenä pitää päättää, miten kysymyksiin tulee vastata (avoimet vai suljetut kysymykset). Otetaanko mukaan En tiedä tai Ei kommenttia - vaihtoehdot. Dr Henrik Räsänen, HAMK 32
Jäsenneltyjen kysymysten kategoriat Alle 25 vuotta 25 35 vuotta 36 45 vuotta 46 55 vuotta Yli 55 vuotta Dr Henrik Räsänen, HAMK 33
Kysymyslomakkeen valmistelu Kyselylomakkeen pituus ja sen vaikutus vastausasteeseen ja vastauksiin on tärkeä. Yleinen uskomus on, että mitä lyhyempi kyselylomake, sitä suurempi todennäköisyys, että lomake palautetaan täysin täytettynä. Olemassaolevassa kirjallisuudessa ei kuitenkaan ole saatavilla standardeja koskien sitä, mikä on lyhyt ja mikä pitkä kyselylomake. Kysymysten tarkka sanamuoto on äärimmäisen tärkeää kysymysten kautta saadun tutkimusinformaation (data) validiteetin maksimoimiseksi. Dr Henrik Räsänen, HAMK 34
Kysymyslomakkeen valmistelu Pitää myös päättää, tulisiko kyselylomakkeessa olla Kyllä ja Ei kysymyksiä, joissa vastaajan täytyy ottaa kantaa. Sen lisäksi kysymyksissä, joissa vastaajan tulee luokitella kysymyksiä, tulee päättää, millaista arviointiasteikkoa käyttää. Esimerkiksi, tulisiko käyttää seur. kuvion asteikkoa vai sanoa Arvioikaa asteikolla 1-10, jossa 10 on tärkein tai positiivisin? Dr Henrik Räsänen, HAMK 35
Asteikko kysymysten luokitteluun Täysin eri mieltä Eri mieltä Osittain samaa mieltä Samaa mieltä Täysin samaa mieltä Dr Henrik Räsänen, HAMK 36
Ohjeita kysymyslomakkeiden valmisteluun 1. Kysymykset pitää esittää erittäin yksinkertaisella ja ytimekkäällä kielellä. Vastaajan tausta tulee ottaa huomioon, mitä tulee koulutustasoon, taustaan, tietoisuuteen ja perehtyneisyyteen puheenaiheen kanssa. Kysymyksiä pitää tämän jälkeen asetella ja sopeuttaa vastaajien yllämainittuihin ominaisuuksiin. 2. Olkaamme mieluummin konservatiivisia tietoisuuden tasoon, koulutukseen, jne. jotka ovat tarpeellisia vastaajalle kysymykseen vastaamiseen. Epärealistisia odotuksia tieto-taidosta, muistista ja vastaamishalukkuudesta ei tulisi vastaajille asettaa. Dr Henrik Räsänen, HAMK 37
Ohjeita kysymyslomakkeiden valmisteluun 3. Tulee tarkistaa, että jokainen ymmärtää kysymykset samalla tavalla: toisin sanoen, jotta jokainen vetää samat johtopäätökset kysymyksistä. 4. Jokaisen kysymyksen tulee käsitellä vain yhtä ulottuvuutta tai näkökantaa. 5. Kysymykset tulisi laatia siten, ettei kysymyksissä ei ole pakotietä. Vastausvaihtoehtoja En tiedä tai En kommentoi ei tulisi tarjota. Dr Henrik Räsänen, HAMK 38
Esimerkkejä pakoteistä Kysymys: Ketkä ovat vientituotteidenne/palveluidenne pääasialliset käyttäjät? Teollisuus Yksittäiset kuluttajat Hallitus En tiedä Kysymys: Onko tai tuleeko vienti olemaan tärkeä liiketoimintamalli yrityksessänne? Kyllä En tiedä Ei Dr Henrik Räsänen, HAMK 39
Ohjeita kysymyslomakkeiden valmisteluun 6. Sen lisäksi kysymysten tulisi olla täsmennettyjä eikä liian yleisiä luonteeltaan, jotta vastaaja ei anna useita vastauksia. 7. Kysymysten ei tule olla liian vihjailevaa lajia ja ohjata vastaajaa kohti vastausta tai määrättyä mielipidettä. 8. Kysymykset tulisi laatia kohteliaaseen ja pehmeään sävyyn. Niiden ei pidä ärsyttää, loukata tai provosoida vastaajaa. On erittäin tärkeätä asettaa arkaluonteiset kysymykset, jos niitä on, oikeaan paikkaan kyselylomakkeessa, jotta vastaaja ymmärtää, miksi kyseinen kysymys on esitetty. Dr Henrik Räsänen, HAMK 40
Ohjeita kysymyslomakkeiden valmisteluun 9. Kysymyksissä käytetyn kielen ja sanojen tulisi olla yksinkertaisia, eikä sisältää tupla- tai piilomerkityksiä. Muuten vastaaja vastaa kysymykseen erilaisella käsityksellä ja täten vaikuttaa negatiivisesti tutkimuksen lopputulokseen. 10. Kysymysten tulisi olla oikeassa järjestyksessä. Helposti vastattavat ja positiiviset kysymykset tulisi asettaa ensimmäisiksi. Kysymysten järjestyksen tulisi olla looginen, yleisistä yksityiskohtaisiin. Dr Henrik Räsänen, HAMK 41
Ohjeita kysymyslomakkeiden valmisteluun 11. Kyselylomakkeen ulkoasu on myös erittäin tärkeä. Sen tulisi näyttää siistiltä, sillä tämä voi vaikuttaa vastaajan halukkuuteen vastata. 12. Viimeisenä, muttei vähäisimpänä, kyselylomake tulee käydä läpi kriittisesti arvioiden tai pyytää ystävää, kollegaa tai neuvonantajaa käymään sen läpi kriittisesti ja antamaan palautetta. On tärkeää ymmärtää, että vastaaja tekee kyselyn tekijälle palveluksen vastaamalla kysymyksiin. Dr Henrik Räsänen, HAMK 42
Otanta empiirisessä tutkimuksessa
Miksi käyttää otantaa? Kun tutkimusongelma on määritelty ja sopiva tutkimusrakenne sekä tiedonkeruuväline on kehitetty, on tutkimuksen seuraava askel valita vastaajat, joilta informaatio kerätään. Eräs mahdollisuus on kerätä tietoa väestön jokaiselta jäseneltä. Toinen tapa on kerätä tietoa osalta populaatiota ottamalla otoksen suuremman ryhmän tekijöistä, ja tämän perusteella päätellä jotain suuresta ryhmästä. Hyvin tunnettu esimerkki tästä on vaalikysely; vastaajien murto-osan perusteella päätellään jotain kaikkien mahdollisten äänestäjien äänestysaikeista. Dr Henrik Räsänen, HAMK 44
Miksi käyttää otantaa? On ainakin kaksi syytä, miksi käyttää otantaa kaikkien yksiköiden tai tekijöiden sisällyttämisen sijasta: kaikkien yksiköiden sisällyttämisen hinta on usein kohtuuton, ja tähän käytettävä aika on usein pitkä. Populaatio ei tässä tapauksessa viittaa pelkästään ihmisiin, vaan myös yrityksiin, tuotteisiin ja niin edelleen. Asiaankuuluvan populaation määrittäminen ei ole aina helppoa. On tärkeätä tietää, kenestä tai mistä halutaan tietoa. Otoskehys on (periaatteessa) luettelo yksiköistä, joista varsinainen otanta poimitaan. Dr Henrik Räsänen, HAMK 45
Otannan poiminnan menettelytapa Askel 1 Määrittele populaatio Askel 2 Tunnista otoskehys Askel 3 Valitse otannan menettelytapa Askel 4 Määrittele otannan koko Askel 5 Valitse otosyksiköt Askel 6 Kerää tieto otosyksiköistä Dr Henrik Räsänen, HAMK 46
Otantamenettelyt Otantamenettelyt voidaan jakaa kahteen laajaan kategoriaan: todennäköisyysotantaan ja ei-todennäköisyysotantaan. Todennäköisyysotannassa jokaisella yksiköllä on tunnettu, nollasta eroava mahdollisuus tulla valituksi otokseen, mikä sallii tilastolliset päätelmät. Ei-todennäköisyysotannassa sitä vastoin ei ole mahdollista tehdä valideja päätelmiä populaatiosta. Tämä antaa ymmärtää, että tälläiset otokset eivät ole edustavia. Edustavalla tarkoitetaan sitä, että on otoksessa tehdyt löydökset ovat kohtuuden rajoissa valideja populaatioon nähden. Dr Henrik Räsänen, HAMK 47
Esimerkkejä ei-todennäköisyysotannasta Kätevyysotannassa, usein käsitelty myös satunnaisena otantana, jostain syystä kätevät yksiköt valitaan otokseen. Harkintaotannassa käytetään harkintaa, jotta saadaan otos, joka edustaa populaatiota. Kiintiöotannassa pidämme huolta, että tietyt yksiköiden alaryhmät, kuten pienet yritykset, keskikokoiset yritykset ja suuret yritykset ovat edustettuina otoksessa suunnilleen samassa suhteessa, missä ne ovat edustettuina populaatiossa. Dr Henrik Räsänen, HAMK 48
Otantamenettelyt Ei-todennäköisyysotannassa otokset on helppo poimia, mutta ne saattavat antaa harhaanjohtavia tuloksia, jos harkinnasta huolimatta ne eivät ole edustavia populaatioihin nähden. Ei-todennäköisyysotantojen suurin epäkohta on, että otokset eivät luo perustaa otoksen koon arvioinnille ja arvion virheelle. Jos mahdollista, todennäköisyysotantaa pitäisi käyttää. Tämä on erityisen tärkeätä, jos halutaan arvioida tuntemattomia parametreja tai tehdä valideja päätelmiä populaatiosta otoksen perusteella. Dr Henrik Räsänen, HAMK 49
Todennäköisyysotannat Yksinkertainen satunnaisotanta Todennäköisyysotantoja on useita tyyppejä. Tunnetuin on yksinkertainen, sattumanvarainen otanta. Tälläisten otantojen pääominaisuus on, että kaikilla populaation yksiköillä on yhtäläinen mahdollisuus (todennäköisyys) tulla sisällytetyksi. Dr Henrik Räsänen, HAMK 50
Todennäköisyysotannat Yksinkertainen satunnaisotanta Seuraavia kysymyksiä tulee harkita sattumanvaraista otantaa toimitettaessa: 1. Mikä on tutkittava perusyksikkö? 2. Miten populaatio, tarkemmin ottaen kohdepopulaatio, tulisi rajata? 3. Mitkä muuttujat tai parametrit ovat kiinnostavia? Parametrit kuvaavat muuttujien olemuksia. Muuttuja voidaan määritellä populaatioon liittyväksi arvoryhmäksi tavalla, jossa jokaisella yksiköllä on vain yksi arvo ryhmästä. Arvo voidaan määritellä tietyn yksikön näkökantaa koskevaksi informaation osaksi. Dr Henrik Räsänen, HAMK 51
Todennäköisyysotannat Yksinkertainen satunnaisotanta 4. Miten otanta tulisi poimia? 5. Kuinka monta yksikköä tulisi sisällyttää otokseen? Yksinkertaisen sattumanvaraisen otannan etu on menetelmän ymmärrettävyys ja sovellettavuus. Haitat ovat, kuitenkin: Kokonainen kehys (listaus kaikista populaation yksiköistä) tarvitaan. Joissain tutkimuksissa otoksen hankkimisen hinta voi olla korkea, jos yksiköt ovat maantieteellisesti hajaantuneet laajalle alueelle. Arvioitsijoiden vakiovirheiden määrä voi olla korkea. Dr Henrik Räsänen, HAMK 52
Systemaattinen otanta Systemaattisessa otannassa valitaan satunnaisen alun jälkeen joka n:s yksikkö. Edellytys systemaattisen otannan soveltamiselle on, että populaation yksiköt voidaan järjestää jollain tapaa. Esimerkkejä ovat: Tiedostoon järjestetyt luettelot; Puhelinluetteloon aakkosjärjestyksen mukaan järjestetyt nimet; Tien laitaan järjestetyt talot; Yksi kerrallaan sisäänkäynnistä kulkevat asiakkaat, ja niin edelleen. Dr Henrik Räsänen, HAMK 53
Systemaattinen otanta Täten populaation yksiköt voidaan numeroida numerosta 1 aina asti yksikköön numero N. Kymmenen prosentin systemaattinen otanta saadaan poimimalla järjestyksessä joka kymmenes yksikkö järjestetystä populaatiosta. Yleensä aloitusyksikkö määritellään poimimalla satunnainen yksikkö populaation ensimmäisen kymmenen yksikön joukosta. Dr Henrik Räsänen, HAMK 54
Systemaattinen otanta Edut: Menetelmä on yksinkertainen, mutta luultavasti suurin etu on, ettei kehys ole aina tarpeellinen. Haittapuolet: Tärkein mahdollinen haittapuoli on salaiset periodisuudet, esimerkiksi että tietyn tuotteen tuotannossa ilmenee vajausta tietyin väliajoin. Jos aloituskohta on epäonninen, koko otanta saattaa koostua virheellisistä tuotteista. Dr Henrik Räsänen, HAMK 55
Kerrosotanta Ositettu otanta on todennäköisyysotanta, missä: Lähdepopulaatio jaetaan molemminpuolisesti poissulkevaan ja perusteelliseen osajoukkoon; Yksiköiden yksinkertainen, sattumanvarainen otanta valitaan itsenäisesti jokaisesta osajoukosta. Tärkeä syy ositetun otannan käyttöön on, että muuttuvuus, ja täten myös arvioiden vakiovirheiden määrä voi laskea. Dr Henrik Räsänen, HAMK 56
Kerrosotanta Kerros (mon. strata) on yksinkertaisesti populaation osa tai alajaosto. Ositettu otanta saadaan poimimalla yksinkertainen, sattumanvarainen otanta jokaisesta populaation kerroksesta. Ositetun otannan idea on varmistaa, että populaation jokainen osa, toisin sanoen populaation kerros saa paremman edustuksen. Dr Henrik Räsänen, HAMK 57
Kerrosotanta Suhteellinen jakaminen tarkoittaa yksiköiden osuuden olevan sama jokaisessa populaation kerroksessa. Tämä periaate on yksinkertaisesti sovellettavissa ja usein tyydyttävä. Populaatio voidaan usein jakaa kerroksiin usein vaihtoehtoisin tavoin. Populaatiokerrostumisen soveltamisessa on tärkeätä ryhmitellä tavalla, joka eriyttää keinot (tai muut parametrit) populaation eri kerroksissa: mitä erilaisempi, sen parempi. Dr Henrik Räsänen, HAMK 58
Kerrosotanta Edut: Ositettu, sattumanvarainen otanta voi antaa enemmän tarkkuutta samalla otoskoolla, tai vaihtoehtoisesti saman tarkkuuden pienemmällä otoskoolla. Ositettu otanta voi antaa myös erilliset tulokset jokaiselle kansankerrokselle. Ositettu otanta myös yksinkertaistaa tiedonkeruuta. Haitat: Täydellinen kehys vaaditaan. Riippuen sovelletusta jakoperiaatteesta, ylimääräistä informaatiota, kuten tietämystä keskihajonnasta ja hinnoista, saatetaan tarvita jokaisessa kansankerroksessa. Dr Henrik Räsänen, HAMK 59
Ryväs(cluster)otanta Ryväsotannassa populaatio jaetaan molemminpuolisesti perusteellisiksi osajoukoiksi. Osajoukoista valitaan sattumanvarainen otos. Jos tutkija tutkii valittujen ryvästen kaikki yksiköt, menetelmää kutsutaan yksivaiheiseksi ryväsotannaksi. Jos yksiköiden otos valitaan todennäköisesti valituista osajoukoista, menetelmää kutsutaan kaksivaiheiseksi ryväsotannaksi. Dr Henrik Räsänen, HAMK 60
Ryväs(cluster)otanta Ryväsotannan ja ositetun otannan väliset yhteneväisyydet tulee huomata. Erottava tekijä on, että ositetussa otannassa otoksen yksiköt valitaan jokaisesta osajoukosta. Ryväsotannassa valitaan otos osajoukosta. Koska ryväsotannalla valitaan otos osajoukoista, jokaisen osajoukon tulisi olla pienimuotoinen malli todellisesta populaatiosta. Täten ryväsotannassa osajoukon tulisi muodostua mahdollisimman heterogeeniseksi. Dr Henrik Räsänen, HAMK 61
Ryväs(cluster)otanta Edut: Ryväsotannan pääasiallinen etu on, että toissijaisista otosyksiköistä ei tarvita täydellistä kehystä. Ryväksistä tarvitaan kuitenkin kehys. Toinen tärkeä etu monissa ryväsotannoissa, kuten alueotannassa, on haastateltavien yksiköiden maantieteellinen keskittyminen. Haittapuolet: Jos tutkittavien ryvästen muuttujissa on suurta vaihtelua, menetelmä saattaa tuottaa kehnoa tarkkuutta. Dr Henrik Räsänen, HAMK 62
Otoskoon määritteleminen Otoskoko riippuu arvioinnin halutusta tarkkuudesta. Mitä suurempi on vaadittu tarkkuus, sitä suurempi otoskoko. Keskivirheen (keskiarvon) käsite on keskeistä otantateoriassa ja otoksen koon määrittelemisessä. Keskivirheen (SE) kaava on: SE = SD n missä SD = keskihajonta n = otoskoko Dr Henrik Räsänen, HAMK 63
Otoskoon määritteleminen Keskivirhekaavan tarkastelu osoittaa, että saadaksemme tietoomme SE:n, meidän täytyy ensin tietää tai arvioida keskihajonta. Otoskokoa määritellessä myös luotettavuusasteen kanssa liitetty arvio pitää ottaa huomioon. Luotettavuusasteen ja määrämittaisen otoksen tarkkuusasteen välillä on kompromissi. Lisäksi budjettirajoitteet pitää ottaa usein huomioon. Dr Henrik Räsänen, HAMK 64
Otoskoon määritteleminen Vastaamatta jättäminen Tulee aina pitää mielessä, että todennäköisyysotantojen tulokset ovat epävarmoja, ja että tälläisten tulosten luotettavuus voidaan laskea ja parantaa otoskoolla. Todellinen, potentiaalinen uhka otantatutkimusten tulosten validiteetille on vastaamatta jättäminen. Kun jotkut otokseen sisällytetyt yksiköt eivät vastaa kysymyksiin, tehokas otoskoko pienenee. Dr Henrik Räsänen, HAMK 65
Otoskoon määritteleminen Vastaamatta jättäminen Vastaamatta jättämisesen oikea ongelma on, että vastaamattomat eroavat yleensä niistä, jotka vastaavat, ja täten ei ole takuuta, että otos on edustava populaatioon nähden. Vastaamatta jättämiset ja muut otantaan liittymättömät virheet ovat usein uhkaavampia kuin tilastolliset virheet. Dr Henrik Räsänen, HAMK 66
Tyypillinen otoskoko ihmis- ja instituutiopopulaatiotutkimuksille Alaryhmäanalyysien määrä Ihmisiä tai talouksia Kansallinen Alueellinen tai erikoinen Kansallinen Instituutioita Alueellinen tai erikoinen Ei lainkaan tai vähän 1000-1500 200-500 200-500 50-200 Muutamia 1500-2500 500-1000 500-1000 200-500 Useita 2500+ 1000+ 1000+ 500+ Dr Henrik Räsänen, HAMK 67
Valmistelu ja tiedon analysointi
Editointi Editoinnin pääasiallinen tarkoitus on tiedon laatutason varmistaminen. Editointiin kuuluu tarkastus, ja tarvittaessa kyselylomakkeen tai havainnointilomakkeen korjaus. Esimerkiksi kyselylomakkeen varovainen editointi voi joskus osoittaa vastauksen kysymykseen olevan ilmiselvästi väärä. Kyselylomakkeiden tai haastattelujen tarkastus voi myös paljastaa ristiriitaista informaatiota. Dr Henrik Räsänen, HAMK 69
Koodaus Luokittelu ja vertailu ovat minkä tahansa tietoanalyysin olennaisia osia. Koodausta voidaan pitää eräänlaisena luokitteluna. Koodauksen ensiaskel on määritellä halutut kategoriat tai luokat, joihin vastaukset tulisi asettaa. Oikeata kategorioiden määrää ei ole olemassa. Kategorioiden määrä riippuu enemmänkin tutkimusongelmasta ja varsinaisesta tiedosta. Dr Henrik Räsänen, HAMK 70
Koodaus Seuraavia koodauksen sääntöje tulee noudattaa: 1. Luokkien (kategorioiden) tulee olla molemminpuolisesti poissulkevia ja perusteellisia. Jokaiselle vastaukselle tulee löytyä vain yksi kategoria. 2. Toinen askel sisältää numeroiden asettamisen luokkiin. Tämä on erityisen tärkeätä, jos tietoa analysoidaan tilastollisesti. Dr Henrik Räsänen, HAMK 71
Koodaus 3. On yleensä parempi käsitellä numeerista tietoa raportoidussa muodossaan kuin muuttaa intervallitai suhdeasteikkoja kategorioihin. Kokonaiskategorioita on aina mahdollista rakentaa analyyttisen prosessin myöhemmässä vaiheessa, mutta käänteinen toiminto ei ole mahdollinen. 4. Suljettujen kysymysten ja useimpien asteikoiden koodaaminen on yksinkertaista, koska koodaus on jo laadittu. Avointen kysymysten voi olla vaikeata, ja kategoriat (luokat) pitää luoda. Dr Henrik Räsänen, HAMK 72
Koodaus 5. On suositeltavaa seurata tiettyjä käytäntöjä tietokoneella tehtyjen tiedon tilastollisten analyysien kanssa. a) Vain yksi kirjain saraketta kohden. b) Käytössä vain numeerisia koodeja. c) Muuttujalle luettelosta määrätyn osuuden tulisi muodostua niin monesta sarakkeesta, kuin vaaditaan muuttujan tallentamiseksi. Jos muuttujassa koodit 1-9 eivät riitä ehdyttämään kategorioita, tarvitaan kaksi (tai enemmän) saraketta. Dr Henrik Räsänen, HAMK 73
Koodaus d)vakiokoodeja tulee käyttää ei informaatiolle, jotta tämä voidaan käsittää vastaukseksi en tiedä. e) Jokaiseen luetteloon pitää koodata vastaajatunniste. Esimerkiksi tunniste 069 ensimmäisessä luettelossa sallii tutkijan yhdistää tietoa toisesta luettelosta samalla tunnisteella. Dr Henrik Räsänen, HAMK 74
Koodaus Koodikirjan kehittäminen on tärkeä osa koodausprosessia. Koodikirja sisältää yleiset ohjeistukset jokaisen kappaleen koodaamiseen. Avoimia kysymyksiä sovellettaessa raportoidaan usein monia vastauksia. Vastaajat voivat antaa useampia vastauksia, ja vastausten yhdistelmät saattavat vaihdella vastaajien kesken. Koodauksen tulisi olla luotettavaa. Jotta voidaan tutkia, mihin asti tämä on totta, kahden (tai useamman) yksilön tulisi koodata samat tiedot itsenäisesti. Kun kokonaistiedon määrä on suuri, on yleistä ottaa otos kokonaisesta tietomäärästä. Dr Henrik Räsänen, HAMK 75
Tilastojen rooli Statistiikan alalle kuuluvat aineistoa kuvaavat ja analysoivat menetelmät, joiden avulla voidaan tehdä johtopäätöksia tutkituista ilmiöistä. Menetelmiin ensimmäisessä kategoriassa viitataan nimellä kuvaava statistiikka, toisen kategorian menetelmiä kutsutaan nimellä johdettu statistiikka. (Johtopäätöksen sisältävä.) Kuvaava statistiikka mahdollistaa tiedon yhteenvedon ja organisoinnin tehokkaalla ja järkevällä tavalla. Johdettua statistiikkaa käytetään johtopäätösten tekemiseen toistuvia malleja tulkitsemalla. Dr Henrik Räsänen, HAMK 76
Yhden muuttujan analysointi Kun aineisto on koodattu ja valmisteltu käsittelyä varten, voidaan aloittaa analysointi. Tutkijan ensimmäinen tehtävä on tutkia toistumistiheyden jakautuminen, jotta voidaan tarkastella jokaisen tutkittavan muuttujan vastausmalleja. Yksittäisen muuttujan esiintymistaajuus, joka tunnetaan nimellä yksivarianttinen esiintymistaajuus, on kaavio, joka esittää havaintojen toistuvuuden jokaisessa muuttujan kategoriassa. Tutkiessaan esiintymistaajuutta, tutkija yksinkertaisesti listaa kategoriat ja laskee havaintojen määrän jokaisessa kategoriassa. Dr Henrik Räsänen, HAMK 77
Ristiintaulukointi Kahta (tai useampaa) muuttujaa tutkitaan usein samanaikaisesti. Kategorisia tai jatkuvia muuttujia, jotka ovat asetettu kategoriseen muotoon, analysoidaan yleisesti ristiintaulukointia käyttämällä. Yleensä riippuvan muuttujan kategoriat asetetaan riveihin ja riippumattomat muuttujat pystysarakkeeseen ristiintaulukoidessa. Johtopäätökset, jotka perustuvat ristiintaulukointiin, eivät välttämättä kestä, mikäli täydentäviä muuttujia lisätään. Dr Henrik Räsänen, HAMK 78
Hypoteesien testaus Tutkimustyössä olemme usein kiinnostuneita hypoteesin testaamisesta, esimerkiksi onko oletettu suhde tai yhteisvaihtelu muuttujien välillä toteutunut. Hypoteesien testaus on erityisen relevanttia kvantatiivisessa tutkimuksessa, mutta sitä esiintyy myös kvalitatiivisessa tutkimuksessa. Emme vahvista olettamuksia sinänsä, mutta hyväksymme ne vääräksi osoittamisen (falsifioinnin) kautta, eli jos nollahypoteesi (H0) on väärä, hyväksymme vaihtoehtoisen olettamuksen. Olettamuksien testauksessa voidaan tehdä kahden tyyppisiä virheitä, eli: hylätä nollahypoteesi, kun se on tosi ja hyväksyä nollahypoteesi, kun se on epätosi. Dr Henrik Räsänen, HAMK 79
Hypoteesien testaus Todennäköisyys, α, nollahypoteesin hylkääminen kun se on totta, on usein määritelty merkitsevyystasoksi. Jos merkitsevyystaso α on p.05, hylkäämme nollahypoteesin viidessä prosentissa tapauksia, joissa se on tosi. Todennäköisyys 1-β määrittelee testin voiman ja se heijastaa testin kykyä nollahypoteesin hylkäämiseen, kun se on epätosi. Dr Henrik Räsänen, HAMK 80
Hypoteesin testivirhetyyppejä Tosi tilanne: Nollahypoteesi on: Johtopäätös Tosi Epätosi Älä hylkää H0 Hylkää H0 Oikea päätös Todennäköisyys = 1 - α Virhe: Tyyppi I Todennäköisyys = α Virhe: Tyyppi II Todennäköisyys = β Oikea päätös Todennäköisyys = 1 - β Dr Henrik Räsänen, HAMK 81
Hypoteesien testaus Tyypillinen hypoteesien testausmenettelytapa on: 1. Määrittele nollahypoteesi tutkimusongelman analysoinnin jälkeen; 2. Valitse sopiva tilastollinen testi, joka on riippuvainen tutkimusrakenteesta ja otannan jakaumasta; 3. Määrittele merkitsevyystaso (α); 4. Kerää tietoa ja laske sopivien testitilastojen arvot; 5. Määrittele testitilaston todennäköisyys nollahypoteesilla; 6. Vertaa saatua todennäköisyyttä määriteltyyn merkitsevyystasoon, jonka jälkeen päätä, hylätäänkö nollahypoteesi vai ei. Dr Henrik Räsänen, HAMK 82
Tietokoneiden käyttö tutkimuksessa Tietokoneet ovat tärkeässä roolissa tutkimuksen teossa. Tietokoneet ovat työkaluja, jotka tallentavat, mahdollistavat pääsyn ja analysoivat tietoa nopeammin ja helpommin. Tilastollisten menetelmien käyttö tarkoittaa nykyään käytännössä tilastollisen tietokoneohjelman käyttöä. Tietokoneavustettu tietoanalyysi säästää aikaa ja mahdollistaa kehittyneemmän tietoanalyysin. Dr Henrik Räsänen, HAMK 83
Kvantitatiivinen ja kvalitatiivinen tieto Kvantitatiivinen tieto 1. Perustuu (johtopäätöksenä) johdettuihin merkityksiin 2. Tulosten keräys numeerisena ja standardisoituna tietona 3. Diagrammien ja tilastojen avulla suoritettu analyysi Kvalitatiivinen tieto 1. Perustuu ilmaistuihin merkityksiin 2. Tulosten keräys kategorioihin luokittelua vaativana, eistandardisoituna tietona 3. Käsitteellistämisen avulla suositettu analyysi Dr Henrik Räsänen, HAMK 84