Sisällysluettelo ESIPUHE 1. PAINOKSEEN... 3 ESIPUHE 2. PAINOKSEEN... 3 SISÄLLYSLUETTELO... 4



Samankaltaiset tiedostot
Metsämuuronen: Tilastollisen kuvauksen perusteet ESIPUHE... 4 SISÄLLYSLUETTELO METODOLOGIAN PERUSTEIDEN KERTAUSTA AINEISTO...

Sisällysluettelo LUKU I METODOLOGIAN PERUSTEET IHMISTIETEISSÄ ESIPUHE...III ESIPUHE KIRJAN TOISEEN PAINOKSEEN... VIII SISÄLLYSLUETTELO...

Kandidaatintutkielman aineistonhankinta ja analyysi

MTTTP1, luento KERTAUSTA

Sisällysluettelo LUKU I METODOLOGIAN PERUSTEET IHMISTIETEISSÄ

MTTTP1, luento KERTAUSTA

Sisältö. Perusteiden Kertaus. Tilastollinen analyysi. Peruskäsitteitä. Peruskäsitteitä. Kvantitatiivinen metodologia verkossa

1. Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet

Kvantitatiiviset tutkimusmenetelmät maantieteessä

Esim. Pulssi-muuttujan frekvenssijakauma, aineisto luentomoniste liite 4

Luento KERTAUSTA Kaksiulotteinen jakauma Pisteparvi, Toyota Avensis -farmariautoja

ALKUSANAT... 4 ALKUSANAT E-KIRJA VERSIOON... 5 SISÄLLYSLUETTELO... 6

MTTTP1, luento KERTAUSTA

Til.yks. x y z

SISÄLTÖ 1 TILASTOJEN KÄYTTÖ...7 MITÄ TILASTOTIEDE ON?

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

Testejä suhdeasteikollisille muuttujille

Kvantitatiiviset menetelmät

Ohjeita kvantitatiiviseen tutkimukseen

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

HAVAITUT JA ODOTETUT FREKVENSSIT

1.Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet

Sisällysluettelo ESIPUHE KIRJAN 1. PAINOKSEEN...3 ESIPUHE KIRJAN 2. PAINOKSEEN...3 SISÄLLYSLUETTELO...4

54. Tehdään yhden selittäjän lineaarinen regressioanalyysi, kun selittäjänä on määrällinen muuttuja (ja selitettävä myös):

KURSSIKYSELYAINEISTO: HUOM! Aineiston tilastoyksikkömäärä 11 on kovin pieni oikean tilastotieteen tekemiseen, mutta Harjoitteluun se kelpaa kyllä!

Otoskoko 107 kpl. a) 27 b) 2654

VALTA9 Kvantitatiiviset tutkimusmenetelmät ja aineistot

b6) samaan perusjoukkoon kohdistuu samanaikaisesti useampia tutkimuksia.

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

Kemometriasta. Matti Hotokka Fysikaalisen kemian laitos Åbo Akademi

3. a) Mitkä ovat tilastolliset mitta-asteikot? b) Millä tavalla nominaaliasteikollisen muuttujan jakauman voi esittää?

TUTKIMUSOPAS. SPSS-opas

Tutkimuksen suunnittelu / tilastolliset menetelmät. Marja-Leena Hannila Itä-Suomen yliopisto / Terveystieteiden tdk

MTTTP5, luento Otossuureita ja niiden jakaumia (jatkuu)

5. Keskiluvut. luokan väliin, ei sen määrääminen tuota vaikeuksia. Näin on seuraavissa esimerkeissä:

Luento JOHDANTO

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170

r = n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit.

Johdatus Ammattikorkeakoulun matematiikkaan ja fysiikkaan

Näistä standardoiduista arvoista laskettu keskiarvo on nolla ja varianssi 1, näin on standardoidulle muuttujalle aina.

Sovellettu todennäköisyyslaskenta B

806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy (1 α) = 99 1 α = 0.

Luottamusvälit. Normaalijakauma johnkin kohtaan

Til.yks. x y z

Kuvioita, taulukoita ja tunnuslukuja. Aki Taanila

Tutkimusongelmia ja tilastollisia hypoteeseja: Perunalastupussien keskimääräinen paino? Nollahypoteesi Vaihtoehtoinen hypoteesi (yksisuuntainen)

Mittaaminen menettely (sääntö), jolla tilastoyksikköön liitetään tiettyä ominaisuutta kuvaava luku, mittaluku.

031021P Tilastomatematiikka (5 op) kertausta 2. vk:een

Sisällysluettelo SISÄLLYSLUETTELO...6 LYHYT SANASTO VASTA-ALKAJILLE JOHDATUS PARAMETRITTOMIIN MENETELMIIN...9

Johdatus varianssianalyysiin. Vilkkumaa / Kuusinen 1

Tilastomenetelmien lopputyö

MTTTP1, luento KERTAUSTA JA TÄYDENNYSTÄ. Tunnusluvut. 1) Sijainnin tunnuslukuja. Keskilukuja moodi (Mo) mediaani (Md) keskiarvo, kaava (1)

Sovellettu todennäköisyyslaskenta B

031021P Tilastomatematiikka (5 op) kertausta 2. vk:een

Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen., jos otoskeskiarvo on suurempi kuin 13,96. Mikä on testissä käytetty α:n arvo?

Kaavakokoelma, testikaaviot ja jakaumataulukot liitteinä. Ei omia taulukoita! Laskin sallittu.

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu

KAHDEN RYHMÄN VERTAILU

pisteet Frekvenssi frekvenssi Yhteensä

Järvi 1 Valkjärvi. Järvi 2 Sysijärvi

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Sisällysluettelo LUKU I METODOLOGIAN PERUSTEET IHMISTIETEISSÄ. Metsämuuronen TTP Tutkimuksen tekemisen perusteet ihmistieteissä

/1. MTTTP5, luento Kertausta. Olk. X 1, X 2,..., X n on satunnaisotos N(µ, ):sta, missä tunnettu. Jos H 0 on tosi, niin

TILASTOLLISTEN MENETELMIEN KIRJO JA KÄYTTÖ LÄÄKETIETEEN TUTKIMUSJULKAISUISSA. Pentti Nieminen

Mitä tarvitsee tietää biostatistiikasta ja miksi? Matti Uhari Lastentautien klinikka Oulun yliopisto

Näistä standardoiduista arvoista laskettu keskiarvo on nolla ja varianssi 1, näin on standardoidulle muuttujalle aina.

Harjoitus 7: NCSS - Tilastollinen analyysi

5 Lisa materiaali. 5.1 Ristiintaulukointi

Tilastollinen aineisto Luottamusväli

6.1.2 Yhdessä populaatiossa tietyn tyyppisten alkioiden prosentuaalista osuutta koskeva päättely

OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi Luento 2

Tilastotieteen johdantokurssin harjoitustyö. 1 Johdanto Aineiston kuvaus Riippuvuustarkastelut...4

Luentokalvoja tilastollisesta päättelystä. Kalvot laatinut Aki Taanila Päivitetty

Sovellettu todennäköisyyslaskenta B

Tarkasteluja lähtötason merkityksestä opintomenestykseen. MAMK:n tekniikassa

Sovellettu todennäköisyyslaskenta B

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Mitä tilastotiede on 7 Historiaa 8 Tilastotieteen nykyinen asema 9 Tilastollisen tutkimuksen vaiheet 10

Harjoitus 2: Matlab - Statistical Toolbox

Sisällysluettelo ESIPUHE... 4 ALKUSANAT E-KIRJA VERSIOON... 5 SISÄLLYSLUETTELO JOHDANTO TILASTOLLISEEN PÄÄTTELYYN TODENNÄKÖISYYS...

S Laskennallinen Neurotiede

MTTTP5, luento Luottamusväli, määritelmä

1. Nollahypoteesi on, että teksti on kirjoitettu lyhyemmällä murteella. Mahdollisiavaihtoehtojaonvainyksieliettäteksti

Tilastotieteen jatkokurssi syksy 2003 Välikoe

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Mittaustulosten tilastollinen käsittely

riippumattomia ja noudattavat samaa jakaumaa.

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin

MONISTE 2 Kirjoittanut Elina Katainen

Estimointi. Vilkkumaa / Kuusinen 1

Koska ovat negatiiviset. Keskihajontoja ei pystytä laskemaan mutta pätee ¾.

Tulkitse tulokset. Onko muuttujien välillä riippuvuutta? Jos riippuvuutta on, niin millaista se on?

Otoskeskiarvo on otossuure, jonka todennäköisyysjakauma tiedetään. Se on normaalijakauma, havainnollistaminen simuloiden

Tutkimustiedonhallinnan peruskurssi

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

RISTIINTAULUKOINTI JA Χ 2 -TESTI

Transkriptio:

Sisällysluettelo ESIPUHE 1. PAINOKSEEN... 3 ESIPUHE 2. PAINOKSEEN... 3 SISÄLLYSLUETTELO... 4 1. METODOLOGIAN PERUSTEIDEN KERTAUSTA... 6 1.1 KESKEISTEN KÄSITTEIDEN KERTAUSTA... 7 1.2 AIHEESEEN PEREHTYMINEN... 7 1.3 AIEMPAAN TUTKIMUKSEEN TUTUSTUMINEN... 8 1.4 TUTKIMUSONGELMAN TÄSMENTÄMINEN... 9 1. TUTKIMUSMENETELMÄN VALINTA JA LUOTETTAVUUS... 10 2. AINEISTO... 12 3. AINEISTON TIIVISTÄMINEN... 16 3.1 FREKVENSSIT JA PROSENTIT... 16 3.2 KESKILUVUT... 22 3.3 ERIKOISEMPIA KESKIARVOJA... 23 3.4 HAJONTALUVUT... 24 4. RISTIINTAULUKOINTI... 28 4.1 RISTIINTAULUKON RAKENTAMINEN... 28 4.2 DIKOTOMINEN RISTIINTAULUKKO... 30 4.3 RISTIINTAULUKON ANALYSOINTI... 31 χ 2 testi... 31 χ 2 testin tilastollinen päättely... 33 Yatesin jatkuvuuskorjain... 34 Fisherin tarkka testi... 3. MITTA-ASTEIKOT JA KORRELAATIO... 37.1 LAATUERO- ELI NOMINAALIASTEIKKO... 37 Kontingenssikerroin... 38 Phi-kerroin...38.2 JÄRJESTYS- ELI ORDINAALIASTEIKKO... 39 Spearmanin järjestyskorrelaatiokerroin... 39.3 VÄLIMATKA- JA SUHDEASTEIKKO... 41 Pearsonin tulomomenttikorrelaatiokertoimen laskeminen... 41 Korrelaatiokertoimen tulkinta... 43 Korrelaation merkitsevyys... 44 Korrelaatiomatriisi... 4 Korrelaatiokertoimen graafinen tulkinta... 46 Anomaliat korrelaatiokertoimessa... 48 Korrelaatioita erikoistilanteisiin... 0 Cohenin Kappa... 0 Osittaiskorrelaatio... 0 Piste-biseriaalinen korrelaatio... 1 Biseriaalinen korrelaatio... 2 4

Tetrakorinen korrelaatio... 6. KESKIARVOJEN ERON TESTAAMINEN... 7 6.1 MANN-WHITNEYN U-TESTI... 8 U-testin laskeminen... 9 U-testin tulkinta... 61 6.2 T-TESTI... 62 Otoskeskiarvon vertaaminen annettuun keskiarvoon... 63 Kahden ryhmän keskiarvon vertailu... 6 t-testi kun ryhmien varianssit ovat eri suuruisia... 67 t-testi kun varianssit ovat yhtä suuria... 69 6.3 USEAMMAN RYHMÄN KESKIARVON VERTAILU... 71 7. LOPUKSI... 72 LÄHTEET... 73 ASIA- JA HENKILÖHAKEMISTO... 74 TAULUKOT... 76

Indeksi = 100* Hinta tänä vuonna Hinta perustasovuonna Perustasovuosi on se vuosi, josta lähtien indeksiä lähdetään laskemaan. Oletetaan että vuosi 199 olisi vuosi, josta lähtien kaikkia kiintoisia koulutuskustannuksia lähdetään tarkkailemaan. Esimerkki on kuvitteellinen sovellus Juha Heikkilän Tilastotieteen ABC kirjan (1993, 142-14) esimerkistä. Vuosi Indeksi Suhteellinen muutos edelliseen vuoteen 199 100-1996 107.8 1.0780 1997 11.9 1.071 1998 129.3 1.116 1999 144.8 1.1199 2000 18.3 1.0932 Voidaan päätellä, että vuodesta 199 vuoteen 2000 koulutuskustannukset ovat nousseet 18.3-100 100* = 8.3 % 100 Koulutuskustannusindeksin keskimääräinen vuosittainen kasvu saadaan geometrisen keskiarvon avulla: G = 1.0780*1.071*1.116*1.11991.0932 = 1.83 (eli vuoden 2000 indeksin arvo) = 1.0962 Indeksi siis kasvoi keskimäärin vuosittain 1.0962-kertaiseksi eli 9.62 %. 3.4 Hajontaluvut Varianssi Hajonta ajontaluvuista ehdottomasti tärkein on varianssi (s 2 ) ja tästä johdettu hajonta (s), jotka kuvaavat arvojen vaihtelua keskiarvon ympärillä. Hyvin yksinkertaisella esimerkillä voidaan osoittaa varianssin merkitys keskiarvon tarkkuuden mittana: Oletetaan kaksi erilaista aineistoa, joilla molemmilla on sama keskiarvo. Kyseisiä aineistoja voidaan kuvata tilanteina 1. ja 2. 24

Esimerkki keskiarvosta ja hajonnasta Tilanne 1. Tilanne 2. Karkea esimerkki keskiarvosta ja varianssista -3-2 -1 1 2 3-3 -2-1 1 2 3 Tilanteessa 1. on kuvattu 10 havaintoa, joiden keskiarvo on 0. Havainnot ovat keskittyneet tasaisesti nollan ympärille. Varianssi on pieni. Tilanteessa 2. on kuvattu myös kymmenen havaintoa, joiden keskiarvo on myös 0. Havainnot eivät kuitenkaan ole lähelläkään keskiarvoa, vaan varianssi on suuri. Varianssi lasketaan vähentämällä keskiarvo x kustakin arvosta x i, korottamalla saadut luvut toiseen potenssiin ( 2 ), summaamalla kaikki keskipoikkeamat yhteen ja jakamalla (n-1):llä. Kaavamuodossa varianssi on siis seuraava: (Σx) 2 Σ (x i x ) 2 Σx 2 n s 2 = eli toisessa muodossa s 2 = n 1 n 1 Mikäli kyseessä on populaation eli kaikkien tunnettujen alkioiden (esimerkiksi koko Suomen kaikkien sairaanhoitajien ikä) varianssi, laskukaavana käytetään aavistuksen yksinkertaisempaa kaavaa: (Σx) 2 Σ (x i - x ) 2 Σx 2 N σ 2 = eli σ 2 = N N Aineistosta lasketun IKÄ -muuttujan varianssi lasketaan seuraavasti. Taulukoidaan arvo (x x) ja sen neliö. Keskiarvohan jo laskettiin, ja se oli 36.2 vuotta. 2

IKÄ x 2 x- x (x - x ) 2 26 676-10.2 104.04 28 784-8.2 67.24 29 841-7.2 1.84 30 900-6.2 38.44 30 900-6.2 38.44 32 1024-4.2 17.64 32 1024-4.2 17.64 3 122-1.2 1.1 3 122-1.2 1.1 37 1369 0.8 0.64 41 1681 4.8 23.4 42 1764.8 33.64 47 2209 10.8 116.64 47 2209 10.8 116.64 2 2704 1.8 249.64 Σ= 43 Σ= 203 Σ= 878.08 x =36.2 Ikä-muuttujan varianssi on siis 878.4/14=62.743. Toisella kaavalla tietenkin saadaan sama tulos: (203-43*43/1)/14= 62.743. Hajonta on suuri, mikä näkyy myös suurissa poikkeamissa keskiarvosta. Toisin sanoen keskiarvo itsessään on osittain harhaanjohtava suure, joka vaatii rinnalleen hajontamitan kuvaamaan poikkeamia tästä keskiarvosta. Keskihajonta Vaihteluväli Varianssin neliöjuuri on nimeltään keskihajonta (standard deviation). Toisin sanoen ikä-muuttujan keskihajonta on se lukuarvo, joka itsensä kanssa kerrottuna antaa 62.743. Tämä luku on pyöreästi 7.921, sillä 7.921*7.921=62.74. Keskihajonnalla on merkittävä osuus normaalijakauman pistemäärien todennäköisyystarkasteluissa. Muitakin hajontalukuja on olemassa, kuten variaatio- eli vaihteluväli. Vaihteluväli kertoo nimensä mukaisesti pienimmän ja suurimman arvon välin. Sovellusten kannalta kuitenkin ehdottomasti tärkeämpiä ovat varianssi ja hajonta. 26