Hypermedian jatko-opintoseminaari



Samankaltaiset tiedostot
Kvantitatiiviset menetelmät

Teema 3: Tilastollisia kuvia ja tunnuslukuja

Metsämuuronen: Tilastollisen kuvauksen perusteet ESIPUHE... 4 SISÄLLYSLUETTELO METODOLOGIAN PERUSTEIDEN KERTAUSTA AINEISTO...

Kvantitatiiviset tutkimusmenetelmät maantieteessä

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Til.yks. x y z

MONISTE 2 Kirjoittanut Elina Katainen

Til.yks. x y z

Sisällysluettelo ESIPUHE 1. PAINOKSEEN... 3 ESIPUHE 2. PAINOKSEEN... 3 SISÄLLYSLUETTELO... 4

Kyselylomakkeiden käyttötapoja:

Esim. Pulssi-muuttujan frekvenssijakauma, aineisto luentomoniste liite 4

Harjoittele tulkintoja

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

3. a) Mitkä ovat tilastolliset mitta-asteikot? b) Millä tavalla nominaaliasteikollisen muuttujan jakauman voi esittää?

Sovellettu todennäköisyyslaskenta B

1. Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet

pisteet Frekvenssi frekvenssi Yhteensä

Sovellettu todennäköisyyslaskenta B

Matemaatikot ja tilastotieteilijät

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

... Vinkkejä lopputyön raportin laadintaan. Sisältö 1. Johdanto 2. Analyyseissä käytetyt muuttujat 3. Tulososa 4. Reflektio (korvaa Johtopäätökset)

Kandidaatintutkielman aineistonhankinta ja analyysi

Kuvioita, taulukoita ja tunnuslukuja. Aki Taanila

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

4. Seuraavaan ristiintaulukkoon on kerätty tehtaassa valmistettujen toimivien ja ei-toimivien leikkijunien lukumäärät eri työvuoroissa:

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

1.Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet

Ohjeita kvantitatiiviseen tutkimukseen

Tutkiva ja kehittävä osaaja (3 op) Kyselyaineisto keruumenetelmänä opinnäytetyössä Ismo Vuorinen

HAVAITUT JA ODOTETUT FREKVENSSIT

Mittaaminen menettely (sääntö), jolla tilastoyksikköön liitetään tiettyä ominaisuutta kuvaava luku, mittaluku.

7. laskuharjoituskierros, vko 10, ratkaisut

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

KURSSIKYSELYAINEISTO: HUOM! Aineiston tilastoyksikkömäärä 11 on kovin pieni oikean tilastotieteen tekemiseen, mutta Harjoitteluun se kelpaa kyllä!

Kyselytutkimus. Yleistä lomakkeen laadinnasta ja kysymysten tekemisestä - 1. Yleistä lomakkeen laadinnasta ja kysymysten tekemisestä - 2

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

Leikkijunan kunto toimiva ei-toimiva Työvuoro aamuvuoro päivävuoro iltavuoro

Tilastomenetelmien lopputyö

Mat Tilastollisen analyysin perusteet. Tilastollisten aineistojen kerääminen ja mittaaminen Tilastollisten aineistojen kuvaaminen Väliestimointi

Luentotesti 3. Kun tutkimuksen kävelynopeustietoja analysoidaan, onko näiden tutkittavien aiheuttama kato

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

ENE-C2001 Käytännön energiatekniikkaa. Aloitustapaaminen Osa III: Tekninen raportointi

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Tilastotieteen johdantokurssin harjoitustyö. 1 Johdanto Aineiston kuvaus Riippuvuustarkastelut...4

Ennen seuraavia tehtäviä tarkista, että KUNNAT-aineistossasi on 12 muuttujaa ja 416 tilastoyksikköä.

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

54. Tehdään yhden selittäjän lineaarinen regressioanalyysi, kun selittäjänä on määrällinen muuttuja (ja selitettävä myös):

YLEISKUVA - Kysymykset

GeoGebra tutkivan oppimisen välineenä: havainto-hypoteesi-testaus

Ennen seuraavia tehtäviä tarkista, että KUNNAT-aineistossasi on 12 muuttujaa ja 416 tilastoyksikköä.

Testejä suhdeasteikollisille muuttujille

MTTTP1, luento KERTAUSTA

b6) samaan perusjoukkoon kohdistuu samanaikaisesti useampia tutkimuksia.

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

2. Aineiston kuvailua

MAY1 Tehtävien ratkaisut Kustannusosakeyhtiö Otava päivitetty Julkaiseminen sallittu vain koulun suljetussa verkossa.

Sisältö. Perusteiden Kertaus. Tilastollinen analyysi. Peruskäsitteitä. Peruskäsitteitä. Kvantitatiivinen metodologia verkossa

II Tilastollisen aineiston ja analyysin edellytysten tarkistaminen

Näistä standardoiduista arvoista laskettu keskiarvo on nolla ja varianssi 1, näin on standardoidulle muuttujalle aina.

ALKUSANAT... 4 ALKUSANAT E-KIRJA VERSIOON... 5 SISÄLLYSLUETTELO... 6

r = n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit.

MTTTP1, luento KERTAUSTA

Määrällisen aineiston esittämistapoja. Aki Taanila

Tilastotieteen kertaus. Kuusinen/Heliövaara 1

TUTKIMUSOPAS. SPSS-opas

Johdatus tilastotieteeseen Tilastollisten aineistojen kuvaaminen. TKK (c) Ilkka Mellin (2005) 1

pitkittäisaineistoissa

Tarkista vielä ennen analysoinnin aloittamista seuraavat seikat:

Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen., jos otoskeskiarvo on suurempi kuin 13,96. Mikä on testissä käytetty α:n arvo?

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1

Aineiston keruun suunnittelu ja toteutus. Tero Vahlberg

Opinnäytetyön kvantitatiivinen osuus

OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi Luento 2

OHJE 1 (5) VALMERI-KYSELYN KÄYTTÖOHJEET. Kyselyn sisältö ja tarkoitus

tilastotieteen kertaus

Testit järjestysasteikollisille muuttujille

Otoskoko 107 kpl. a) 27 b) 2654

Väliestimointi (jatkoa) Heliövaara 1

Tilastollisten aineistojen kuvaaminen

Webropol 3.0 tulosten raportointi. Aki Taanila

Oma nimesi Tehtävä (5)

1. Normaalisuuden tutkiminen, Bowmanin ja Shentonin testi, Rankit Plot, Wilkin ja Shapiron testi

Mittariston laatiminen laatutyöhön


Kvantitatiiviset menetelmät

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

MTTTP1, luento KERTAUSTA JA TÄYDENNYSTÄ. Tunnusluvut. 1) Sijainnin tunnuslukuja. Keskilukuja moodi (Mo) mediaani (Md) keskiarvo, kaava (1)

Graduaineiston analysointi

Luottamusvälit. Normaalijakauma johnkin kohtaan

pitkittäisaineistoissa

Muuttujien määrittely

OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi. Luento 3

Hannu mies LTK 180 Johanna nainen HuTK 168 Laura nainen LuTK 173 Jere mies NA 173 Riitta nainen LTK 164

MATEMAATTIS- LUONNONTIETEELLINEN OSAAMINEN

FSD3028. Julkiseen työnvälitykseen ilmoitettujen avointen työpaikkojen rekisteriaineisto Koodikirja

A130A0650-K Tilastollisen tutkimuksen perusteet 6 op Tentti / Anssi Tarkiainen & Maija Hujala

Mat Operaatiotutkimuksen projektityöseminaari

Harjoitus 7: NCSS - Tilastollinen analyysi

MTTTP1, luento KERTAUSTA

SPSS-pikaohje. Jukka Jauhiainen OAMK / Tekniikan yksikkö

Transkriptio:

Hypermedian jatko-opintoseminaari 21.10.2005 Heli Raassina Käsiteltävät aiheet Kyselylomakkeen laatiminen Aineiston talletus Puuttuvat havainnot, vinoutumat, havaintojen painottaminen, muuttujien muuntaminen Keskiluvut, hajontaluvut Raportoinnista: numerotulosten esittäminen, taulukot, graafinen esitys 1

Kyselylomakkeen laatiminen Hyvin suunniteltu lomake edesauttaa kyselyn onnistumista kirjallisuuteen tutustuminen tutkimusongelman pohtiminen ja täsmentäminen käsitteiden määritteleminen miten aineistoa käsitellään jatkossa Tutkimuslomakkeen laatimisen vaiheet (Heikkilä, 1999) tutkittavien asioiden nimeäminen lomakkeen rakenteen suunnittelu kysymysten muotoilu lomakkeen testaus lomakkeen rakenteen ja kysymysten korjaaminen lopullinen lomake Kyselylomakkeen laatiminen Hyvä tutkimuslomake (Heikkilä, 1999) on selkeä ja houkuttelee vastaamaan teksti ja kysymykset ovat hyvin aseteltu vastausohjeet ovat selkeät ja yksiselitteiset kysytään vain yhtä asiaa kerrallaan kysymykset etenevät loogisesti kysymykset on numeroitu juoksevasti samaa aihetta koskevat kysymykset on ryhmitelty kokonaisuuksiksi, joilla voi olla selkeät otsikot alussa helppoja kysymyksiä kontrollikysymyksillä varmistetaan vastausten luotettavuus (ei liian monta) lomake ei ole liian pitkä lomake saa vastaajan tuntemaan vastaamisen tärkeäksi lomake on esitestattu se on helppo syöttää ja käsitellä tilasto-ohjelmalla 2

Kysymysten sisältö ja muotoilu Kysymyksiä voidaan ryhmitellä sisällön perusteella mm. seuraavasti: Täsmälliset tosiasiakysymykset, kuten ikä tai kotipaikka. Kysymyksiä laatiessa on varmistettava kysymyksen asettelun yksiselitteisyys. Arvionvaraiset tosiasiakysymykset ovat usein määriä tai useutta mittaavat kysymykset (kuten kuinka usein tai milloin viimeksi ). Harkittava annetaanko valmiit vastausvaihtoehdot vai esitetäänkö kysymys avoimena. Käyttäytymisen syitä mittaavat kysymykset vaativat usein kvalitatiivisia tutkimusmenetelmiä. Asenteita, arvoja ja mielipiteitä mitataan usein Likertin asteikollisilla kysymyksillä. Yleensä esitetään useita samaa asiaa käsitteleviä väittämiä, joiden avulla selvitetään vastaajien johdonmukaisuutta. Sosiaalisia suhteita voidaan mitata sosiometrisin menetelmin. Siten saadaan tietoa mm. yksilöitten vuorovaikutussuhteista. Kysymysten sisältö ja muotoilu Esimerkki 1 (mukaillen Heikkilä, 1999) 1. Tuleeko talouteenne Helsingin Sanomat tai Aamulehti? Kyllä Ei 2. Ei pidä paikkaansa, että näyttöpäätetyöskentely ei aiheuta päänsärkyä. täysin samaa mieltä jokseenkin samaa mieltä jokseenkin eri mieltä täysin eri mieltä en osaa sanoa 3

Kysymysten sisältö ja muotoilu Esimerkki 2 1. Tarjottiinko teille mahdollisuutta koeajaa haluamanne auto? Kyllä Ei Pyysin itse 2. Koeajoiko myyntiliikkeen edustaja vaihdossa antamanne auton ennen tarjouksen antamista? Kyllä Ei Minulla ei ollut vaihtoautoa Millainen on hyvä kysymys? Kysytään vain yhtä asiaa kerrallaan Kysymys on tarpeellinen ja hyödyllinen Se ei ole liian pitkä tai monimutkainen eikä johdatteleva vaan ymmärrettävä, selkeä ja yksiselitteinen Kysymyksen kieliasu on moitteeton Sisältää tarvittaessa tyylikeinoja olennaisen esiin tuomiseksi Ei sisällä sivistyssanoja, slangia eikä erikoissanastoa Ei sisällä kaksinkertaista kieltoa Mahdollistaa tulosten saamisen halutulla tavalla (Heikkilä, 1999) 4

Vastausvaihtoehdoissa huomioitavia asioita Vastausvaihtoehdot kannattaa luetella numeroilla (esim. kirjaimien sijaan). Tämä helpottaa aineiston tallentamista havaintomatriisiin ja vähentää siinä vaiheessa syntyviä virheitä. Vastausvaihtoehtojen tulisi olla toisensa poissulkevia. Raportointivaiheessa esim. Likert-asteikolliset muuttujat antavat enemmän mahdollisuuksia tutkimustulosten kuvailuun. Kannattaa turvautua aiemmin käytettyihin ja tiedeyhteisön omaksumiin vastausskaaloihin. Vaihtoehtoa en osaa sanoa tms. Kannattaa käyttää tarpeen mukaan mutta harkiten. Monivalintakysymyksiin on myös hyvä sisällyttää vaihtoehto joku muu mikä? Vastausvaihtoehdoissa huomioitavia asioita Esimerkki 3 (Lähde:http://www.fsd.uta.fi/menetelmaopetus/kyselylomake/esimerkki10.html) Kuinka monena päivänä viikossa seuraat televisiosta kotimaisia viihdesarjoja? 1 Kerran viikossa 2 2-3 krt viikossa 3 3-5 krt viikossa 4 5-7 krt viikossa Halutaan selvittää erään radiokanavan uutislähetysten keskimääräistä kuuntelemisaktiivisuutta viimeksi kuluneiden 12 kuukauden ajalta. Vastausvaihtoehdot ovat: 1 Useita kertoja päivässä 2 Päivittäin 3 Muutaman kerran viikossa mutta en päivittäin 4 Kerran pari viikossa 5 Kerran pari kuukaudessa 6 Harvemmin tai en koskaan 5

Johdattelevat tai epätasapainoiset kysymykset Esimerkki 4 (Lähde:http://www.fsd.uta.fi/menetelmaopetus/kyselylomake/esimerkki11.html) Ovatko talvet tulleet lämpimämmiksi viime vuosina? 1 Hyvin paljon lämpimämmiksi 2 Melko paljon lämpimämmiksi 3 Jonkin verran lämpimämmiksi 4 Eivät ole tulleet lämpimämmiksi Jos vastasit "eivät ole tulleet lämpimämmiksi", perustele kantasi: Tasapainoisen vastausasteikon tulee yleensä sisältää kaksi toisilleen vastakohtaista ääripäätä sekä neutraali vastausvaihtoehto. Kysymyslauseen tulisi sisältää viittauksia joko molempiin vastausskaalan ääripäihin tai ei kumpaakaan niistä. Esimerkissä 4 tasapainoinen kysymyksenasettelu tarkastelisi käsityksiä talvien keskimääräisestä lämpötilasta. Vastausvaihtoehdot voisivat vaihdella välillä keskimääräistä kylmemmäksi ja keskimääräistä lämpimämmäksi. Aineiston tallennus Kun aineisto on kerätty se syötetään tilastollista käsittelyä varten havaintomatriisiin. Havaintomatriisi on taulukko, jossa vaakarivit vastaavat havaintoja ja pystyrivit muuttujia. Esim. k00nro k01ika k02spuoli k03 k04 k05 k06 1 27 1 4 4 5 2 2 36 2 1 3 3 2 3 42 2 5 4 2 5 4 38 1 5 3 4 3 5 54 1 4 1 2 2 6 21 1 3 3 3 3 6

Muuttujien muunnokset Analysointivaiheessa voi usein joutua muuttamaan jo olemassa olevia muuttujia tai niiden pohjalta luodaan uusia muuttujia. Olemassa olevia muuttujia muutetaan uudelleen koodaamalla, jolloin alkuperäisen muuttujan arvot vaihdetaan uusiin arvoihin. Esim. Jos ikä on kysytty vuosina, voi olla tarpeellista muodostaa nk. ikäryhmiä. Tällöin alle 25 -vuotiaat saisivat uuden arvon 1, 25-35 -vuotiaat arvon 2 jne. Muuttujien muunnokset Kokonaan uusia muuttujia luodaan usein jonkun matemaattisen kaavan avulla. Esim. Tiedämme kunnan asukasluvun ja pinta-alan. Voimme laskea asukastiheyttä kuvaavan uuden muuttujan TIHEYS=ASUKASLUKU/PINTA-ALA Uudesta muuttujasta on kysymys myös silloin kun muodostetaan nk. summamuuttuja Nimensä mukaan summamuuttuja muodostetaan yhdistämällä useita samaa ilmiötä eri tavoin mittaavia muuttujia. 7

Summamuuttujien luominen Muuttujien k03, k04 ja k05 summamuuttuja SUMMA=k03+k04+k05 Jos summattavat muuttujat saavat arvoja väliltä 1-5 saamamme muuttuja SUMMA saa arvoja väliltä 3-15. Joskus voi olla mielekkäämpää, että summamuuttujan arvon vaihteluväli on sama kuin alkuperäisillä muuttujilla. Tämä saadaan laskemalla SUMMA=(k03+k04+k05)/3 Summamuuttujien luominen Summamuuttujia muodostettaessa summattavien muuttujien tulisi olla yhteismitallisia. Tämä tarkoittaa sitä, että muuttujat on mitattu samalla mitta-asteikolla. Jos näin ei ole, summattavat muuttujat täytyy saattaa yhteismitallisiksi standardoimalla ne. Z = x µ s missä x on havaittu muuttujan arvo, µ on muuttujan keskiarvo ja s on muuttujan hajonta. 8

Puuttuvat havainnot Puuttuvat havainnot saattavat vääristää analyysin tuloksia ja siksi niihin kannattaa kiinnittää erityisesti huomiota. Tutkijan pitää päättää tapauskohtaisesti, miten puuttuvien havaintojen kohdalla toimitaan sillä yleispätevää toimintasääntöä ei ole. Seuraavaksi tarkastellaan puuttujien havaintojen poistamiseen tai korvaamiseen liittyviä asioita. Puuttuvat havainnot Puuttuvien havaintojen poistaminen Tarkoittaa kaikkien niiden havaintojen poistamista, jossa yhdenkin muuttujan kohdalla tieto puuttuu. (Listwise deletion) Ongelmana voi olla reilustikin pienentyvä otoskoko Ennen kuin havaintoja lähtee poistamaan kannattaa tarkistaa, miten puuttuvat havainnot ovat jakautuneet (tasaisesti koko aineistoon vai tiettyyn erityisryhmään). Muuttujien poistaminen Tilanne voi olla myös se, että tietystä muuttujasta puuttuu huomattava määrä havaintoja. Silloin kannattaa miettiä kuinka oleellinen muuttuja on tutkimuksen kannalta ja voisiko sen pudottaa jatkoanalyysistä kokonaan. Hyvä puoli on, että havaintojen määrä ei muuttujan poistamisen jälkeen vähene. 9

Puuttuvat havainnot Puuttuvien havaintojen pareittainen poistaminen Sopii käytettäessä sellaisia tilastollisia menetelmiä, jotka perustuvat korrelaatiomatriisin analysointiin. Korrelaatiomatriisia laskettaessa otetaan huomioon vain ne havainnot, joista on tiedot niillä kahdella muuttujalla, joista korrelaatio lasketaan. Näin lasketut korrelaatiomatriisin arvot voivat perustua eri määriin havaintoja. Ei pienennä niin paljon aineistoa kuin suoraan puuttuvien havaintojen poistaminen. Keskiarvojen käyttö Puuttuvien muuttujan arvojen tilalle voidaan myös koodata ennalta päätetty arvo. Yleensä tuo ennalta päätetty arvo on muuttujan keskiarvo. Ei pienennä aineiston kokoa mutta pienentää muuttujien hajontaa. Puuttuvat havainnot Ryhmäkeskiarvojen käyttö Koko muuttujan keskiarvon sijaan, muuttujan arvo voidaan koodata ryhmäkeskiarvolla. Ongelmana on se, että ryhmien sisäinen samankaltaisuus ja toisaalta ryhmien väliset erot korostuvat. Muita tapoja Aineisto voidaan jakaa ryhmiin (esim. miehiin ja naisiin). Puuttuvan arvon kohdalle koodataan havaintomatriisissa edellisen havainnon arvo. Ei vähennä muuttujien välistä hajontaa. Jos puuttuvat havainnot sisällytetään analyysiin, ne kannattaa koodata riittävän eroavasti muista havaintojen arvoista. 10

Havaintojen painottaminen Otosaineiston jakaumaan voi tulla vinoutumia esim. vastauskadon tai väärän otosasetelman vuoksi Tällöin aineistoa voidaan painottaa, jotta otos kuvaisi paremmin tutkimuksen perusjoukkoa. Esim. Tutkimukseen on haastateltu 50 miestä ja 50 naista neljästä eri ikäryhmästä. Havaintoja on siis kaikkiaan 400. Tämä ei kuitenkaan vastaa suomalaisten todellista ikä- ja sukupuolijakaumaa. Asia voidaan korjata painottamalla aineistoa. Painot saadaan laskettua kaavalla: w i = NK n i i missä N on havaintojen lukumäärä, K i on toivottu jakauma ryhmässä i ja n i havaittu jakauma ryhmässä i. Keskiluvut Keskiluvut kuvaavat muuttujien arvon keskimääräistä suuruutta. Soveltuvan keskiluvun valintaan vaikuttaa mittauksen asteikko Luokitteluasteikko Järjestysasteikko Välimatkaasteikko Suhdeasteikko Moodi X X X X Mediaani - X X X Aritmeettinen keskiarvo - - X X Geometrinen ja harmoninen keskiarvo - - - X 11

Keskiluvut Moodi Moodi on se arvo, jonka frekvenssi aineistossa on suurin. Moodeja voi olla myös useampia. Mediaani Mediaani on suuruusjärjestykseen asetetuista muuttujan arvoista keskimmäinen. Jos havaintoja on parillinen määrä: Järjestysasteikollisella muuttujalla mediaani on kumpikin keskimmäisistä arvoista Välimatka- ja suhdeasteikollisella muuttujalla mediaani on kahden keskimmäisen arvon keskiarvo Keskiluvut Esimerkki Aineistossa välimatka-asteikollisen muuttujaan k03 liittyi kuusi havaintoa, joiden arvot ovat 4,1,5,5,4,3 Moodit ovat tällöin 4 ja 5 Mediaani saadaan kun muuttujien arvot järjestetään suuruus järjestykseen (1,3,4,4,5,5) Koska havaintoja on parillinen määrä mediaanin arvoon tässä tapauksessa kahden keskimmäisen arvon keskiarvo eli 4 12

Keskiluvut Aritmeettinen keskiarvo (mean) KESKIARVO=muuttujan arvojen summa/havaintojen määrä Poikkeavat muuttujien arvot voivat vaikuttaa suuresti aritmeettiseen keskiarvoon Geometrinen ja harmoninen keskiarvo Käytetään yleensä kasvuilmiöihin ja indeksilaskentaan liittyvissä erikoistapauksissa Geometrinen keskiarvo G ja harmoninen keskiarvo H saadaan seuraavasti G = n x1 x2 Κ x n H = n 1 1 1 + + Κ + x x x 1 2 missä n on havaintojen lukumäärä ja x i viittaa havainnon i arvoon. n Hajontaluvut Hajontaluvut kuvaavat muuttujien arvojen vaihtelua käytetyn keskiluvun ympärillä. Myös hajontaluvuilla käytetty mitta-asteikko vaikuttaa hajontaluvun valintaan Luokitteluasteikko Järjestysasteikko Välimatkaasteikko Suhdeasteikko variaatiosuhde X X X X vaihteluväli - X X X vaihteluvälin pituus - - X X keskihajonta - - X X variaatiokerroin - - X X 13

Hajontaluvut Variaatiosuhde Kertoo, kuinka suuri osuus havainnoista on muuttujan moodiluokassa Variaatiosuhde v=1-(havaintojen määrä moodiluokassa/havaintojen määrä) Variaatiosuhteen arvo vaihtelee nollan ja yhden välillä Vaihteluväli ilmoittaa pienimmän ja suurimman muuttujan arvon välin Kun muuttujien arvot x 1 x n on järjestetty pienimmästä suurimpaan, vaihteluväli W=[x 1,x n ]. Hajontaluvut Esimerkki Aineistossa välimatka-asteikolliseen muuttujaan k03 liittyi kuusi havaintoa, joiden arvot ovat 4,1,5,5,4,3 Variaatiosuhde lasketaan siitä muuttujaluokasta, jossa on eniten havaintoja. Nyt siis v=1-(2/6)=2/3. Vaihteluväli W=[1,5] 14

x Hajontaluvut Vaihteluvälin pituus on muuttujan suurimman ja pienimmän arvon erotus w= x n -x 1, missä x n on suurin arvo ja x 1 pienin arvo Keskihajonta kuvaa, kuinka kaukana yksittäiset muuttujan arvot ovat keskimäärin muuttujan aritmeettisesta keskiarvosta Kun tarkasteltavana on perusjoukko, keskihajonta ( ) 2 1 n i n i = 1 s = x x missä n on havaintojen lukumäärä, x i viittaa havainnon i arvoon ja x tarkoittaa aineiston aritmeettista keskiarvoa. Otos keskihajonnasta puhuttaessa summan kerroin 1/n korvataan kertoimella 1/(n-1) Hajontaluvut Variaatiokerroin suhteuttaa keskihajonnan aineiston keskiarvoon Variaatiokerroin s V = x missä s on muuttujan keskihajonta ja x muuttujan keskiarvo 15

Vinous ja huipukkuus Vinous (skewnesis) mittaa jakauman symmetrisyyttä. Jakauma voi olla vino siten että valtaosa aineistomassasta nojautuu joko oikealle tai vasemmalle ja jakauman häntä ulottuu vastakkaiseen suuntaan. Huipukkuus (kurtosis) ilmoittaa jakauman huipun korkeuden normaalijakaumaan verrattuna. Jakauman vinousarvo S -0,5<S<0,5 jakauma on jokseenkin symmetrinen Jakauman huipukkuusarvo K Jos K<-0,5 tai K>0,5 on syytä testata jakauman normaalisuutta tarkemmin Vinous ja huipukkuus Oman oppimisen kannalta olisi tärkeää, että opettaja loisi mielenkiintoa opiskeltavaan asiaan. 60 Descriptive Statistics Lukumäärä 50 40 30 20 10 0 2,0 3,0 4,0 5,0 Std. Dev =,86 Mean = 4,2 N = 122,00 N Minimum Maximum Mean Std. DSkewness i ti Kurtosis Statistic Statistic Statistic Statistic Statistic Statistic Std. Error Statistic Std. Error 71. Oman oppimisen kannalta olisi tärkeää, että opettaja loisi mielenkiintoa opiskeltavaan asiaan. 122 2 5 4,19,856 -,616,219 -,737,435 jokseenkin eri mielta - täysin samaa mieltä 16

Kyselyaineiston dokumentointi ja raportointi Jotta tilasto-ohjelman tulokset eivät jäisi pelkiksi numeroiksi, tulisi kvantitatiivisen aineiston raportointiin kiinnittää erityisesti huomiota. Seuraava raportoinnin vinkkilista voi auttaa välttämään tyypillisimpiä sudenkuoppia (Lähde: Valtakunnallisen menetelmäopetuksen tietovaranto) 1. Dokumentoi muuttujien tarkka sisältö Esitä analyysissä käytettyjen muuttujien kysymykset ja vastausvaihtoehdot sanatarkasti Kyselylomake olisi hyvä sisällyttää liitteeksi raporttiin Myös alkuperäisistä muuttujista muodostetut uudet muuttujat tulisi dokumentoida yksityiskohtaisesti Kyselyaineiston dokumentointi ja raportointi 2. Poimi tekstiin olennainen Tällä tarkoitetaan muutamien keskeisten lukujen ja mahdollisten erojen esiin nostamista eikä esim. kokonaisen taulukon auki kirjoittamista Tämä olisi hyvä tehdä vertaillen, yhdistellen ja yleistäen Tutkimuksesta nouseva uusi tieto tulisi nostaa selkeästi esille Paljon tutkitulla alueella olisi hyvä viitata aiempiin tutkimuksiin ja tutkailla omia tuloksia niiden pohjalta 3. Kuvaile jakaumatiedot tiiviisti ja käytä liitteitä Jakaumien kuvaus sekä leipätekstissä, että taulukoissa Suuremmissa aineistoissa prosentuaalinen tarkastelu riittää. Havaintoyksiköiden kokonaismäärä n tulisi kuitenkin ilmoittaa. Kuvailun laajuutta ja tarkkuutta voi suhteuttaa aineiston kokoon ja tutkimuksen tarkoitukseen 17

Kyselyaineiston dokumentointi ja raportointi 4. Suhteuta sanavalinnat ja tulosten tarkkuustaso aineistotyyppiin Ei ole syytä esittää tuloksia esim. usean desimaalin tarkkuudella vaan pyöristää kokonaisluvuksi 5. Ota huomioon kenelle kirjoitat Koska usein ensisijainen yleisö on tiedeyhteisö ei kirjoittajalla ole varaa epäselvään tekstiin Myös yleisimpien tunnuslukujen laskutavan voi olettaa tunnetuksi 6. Kuvaile ennen selittävää analyysiä Ennen monimuuttujamenetelmiin siirtymistä tulisi esittää perustavia kuvailutietoja aineistosta Kyselyaineiston dokumentointi ja raportointi 7. Esitä tulosten epävarmuustekijät kattavasti ja johdonmukaisesti Tutkimuksen tieteellisen arvon kannalta on oleellista tietää, kuinka suurella varmuudella otokseen perustuvat tulokset pitävät paikkansa perusjoukossa Tulosten arviointi ja luotettavuuteen liittyvien seikkojen esittely on yhtä tärkeä kuin varsinaisten tulosten esittäminen 8. Vertaile konteksti- ja aineistosidonnaisesti On hyvä pohtia, liittyykö esim. aineistonkeruuajankohtaan tulosten laatuun vaikuttavia tekijöitä Kontekstitekijöiden muutokset voivat selittää osaltaan muutoksia tutkimustuloksissa aiempiin tutkimuksiin verrattaessa 9. Aineistolähteiden merkitseminen Jos tutkimuksessa käytetään muiden keräämiä aineistoja, on aineistolähteet merkittävä tutkimustekstiin ja lähdeluetteloon julkaisujen tapaan. 18

Numerotulosten esittämisestä Leipätekstin tulee tiivistää tutkimuksen numerotuloksia sekä osoittaa missä viitatut tulokset on mainittu ja miten ne on tuotettu Tekstin tulisi olla vaihtelevaa niin sanavalinnoilta kuin sanajärjestykseltäänkin Prosenttitaulukoita voidaan käyttää asiakokonaisuuden selvittämisen pohjana Numerotiedon esittämiseen tarkoitettuja kuvioita tulisi käyttää harkiten. Aikasarjat sekä riippuvuuksiin liittyvät säännönmukaisuudet havainnollistuvat usein parhaiten graafien avulla Numerotulosten esittämisestä Taulukoissa selite sijoitetaan yleensä taulukon alle, kuvioissa selitteitä on mahdollista sijoittaa vapaammin Kaikkia tutkimuksen työtaulukoiden tietoja ei ole syytä julkaista Nyrkkisääntönä voidaan pitää, että kaikista oleellisimmat taulukot sisällytetään varsinaiseen raporttiosaan ja seuraavaksi tärkeimmät tulokset esitetään liitetaulukkona 19

Taulukoiden tekeminen Taulukot ovat helppo tapa tiivistää informaatiota Taulukon antama kuva voi jäädä helposti kylmäksi ja etäiseksi Siksi taulukkoa tulisikin täydentää muilla esitystavoilla Tekstiin sijoitetut taulukot tulisi aina tulkita Taulukoiden tekeminen Taulukon tekemisen muistilista (Heikkilä, 1999) Numeroi ja nimeä taulukko Muokkaa taulukko yksinkertaiseksi ja selkeäksi Kerro otsikossa kuvatun ilmiön paikka ja aika, käytetyt mittayksiköt ja prosenttilukutaulukossa perusarvo Ilmoita tarvittaessa tietojen lähde ja luotettavuuteen liittyvät tiedot alaviitteessä Kommentoi ja analysoi taulukosta ilmenevät pääasiat 20

Graafinen esitys Kuvioiden tarkoituksena on helpotta oleellisen informaation hahmottamista. Kussakin tapauksessa julkaistavaksi valitaan kuvio, joka on siinä tilanteessa selkein ja luonteenomaisin. Yhden muuttujan tarkasteluun liittyy yleensä jakauman sijainnin ja hajonnan kuvaaminen Kahden muuttujan tapauksessa mielenkiinto on usein muuttujien välisessä riippuvuudessa. Riippuvuutta voidaan tarkastella esim. Pylväs-, viiva- ja laatikko-jana -kuviolla Graafinen esitys Kahden tai useamman muuttujan kuvioiden tulkintaa helpottaa, jos vaaka-akselilla on taustamuuttuja tai riippumaton muuttuja (jos mahdollista) Kuvion informatiivisuuden vuoksi, siihen ei tulisi laittaa liikaa muuttujia tai liian useita luokkia Kun valitsee kuvioita tutkimusraporttiin, kannattaa miettiä palveleeko kuvio lukijaa ja kuinka merkityksellinen se on esitettävän asian kannalta 21

Pylväskuvio vai sektoridiagrammi? Pylväsdiagrammi Korostaa muuttujien arvojen järjestystä Valittavana joko lukumäärät tai prosentit Soveltuu muuttujille, joka saa useita arvoja Sektoridiagrammi Prosenttiosuudet korostuvat Soveltuu tilanteisiin, joissa arvojen järjestystä ei haluta korostaa Pylväskuvio vai viivakuvio? Molemmat soveltuvat hyvin kumulatiivisiin tarkasteluihin Tällöin ideana on kuvata kasautuvia tai summautuvia lukumääriä tai prosentteja Pylväsdiagrammi Näyttävämmän näköinen Jotta luettavuus säilyisi, luokkia on oltava kohtuullinen määrä Viivakuvio Soveltuu paremmin, kun halutaan kuvata muuttujan muutosta ajan suhteen 22

Laatikko-jana -kuvio Havainnollinen, kun tarkastellaan muuttujan jakauman sijaintia ja hajontaa Sopii tilanteisiin, joissa muuttuja saa paljon eri arvoja (esim. Asenneväittämistä muodostetut summamuuttujat) Sopii erityisesti jakaumien vertailuun Laatikko-jana -kuvio perustuu tunnuslukuihin minimi, alakvartiili, mediaani, yläkvartiili ja maksimi Laatikko-jana -kuvio Minun on helppo ymmärtää matematiikan tehtävien ja todistusten päättelyketjut. 6 täysin eri mieltä - täysin samaa mieltä 5 4 3 2 1 0 36 70 N = 3 Missing 68 ei 51 kyllä kurssin läpäisy 23

Lähteet Heikkilä, T. 1999. Tilastollinen tutkimus. 2.uud.painos. Helsinki. Edita. 320 s. Holopainen, M. & Pulkkinen, P. 1997. Tilastolliset menetelmät perusteet. Porvoo. Weilin+Göös. 301 s. Menetelmäopetuksen valtakunnallinen tietovaranto, http://www.fsd.uta.fi/menetelmaopetus/intro.html (18.10.2005) Metsämuuronen, J. 2003. Tutkimuksen tekemisen perusteet ihmistieteissä. 2.uud.panos. Helsinki. International Methelp Ky. 772 s. Tilastokeskus verkkokoulu, http://www.stat.fi/tk/tp/verkkokoulu/index.html (18.10.2005) 24