SELITETTÄVÄ MUUTTUJA SELITTÄVÄ MUUTTUJA. Välimatka- tai suhdelukuasteikko. Laatuero- tai järjestysasteikko. Laatuero- tai järjestysasteikko

Samankaltaiset tiedostot
Kvantitatiiviset menetelmät

pq n s n Kyllä Ei N Jäsenyys 5,4% 94.6 % 1500 Adressi 21,6% 78.4 % 1495 Lahjoitus 23,7% 76.3 % 1495 Mielenosoitus 1,1% 98.9 % 1489

Sisältö. Kvantitatiivinen metodologia verkossa. Monitasomallintaminen. Monitasomallit. Regressiomalli dummy-muuttujilla.

Tehtävä 1. Riku Eskelinen DEMOVASTAUKSET Demokerta 3/ vk 15 Tilastomenetelmien peruskurssi TILP150 Tulostuspv Sivu 1/6

HAVAITUT JA ODOTETUT FREKVENSSIT

Testit järjestysasteikollisille muuttujille. Testit järjestysasteikollisille muuttujille. Testit järjestysasteikollisille muuttujille: Esitiedot

1. (Jatkoa Harjoitus 5A tehtävään 4). Monisteen esimerkin mukaan momenttimenetelmän. n ne(y i Y (n) ) = 2E(Y 1 Y (n) ).

Mat Tilastollisen analyysin perusteet. Testit suhdeasteikollisille muuttujille. Avainsanat:

Tunnuslukuja 27 III TUNNUSLUKUJA

Kvantitatiiviset menetelmät

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TILASTOT: johdantoa ja käsitteitä

RISTIINTAULUKOINTI JA Χ 2 -TESTI

Tilastolliset menetelmät: Tilastolliset testit

voidaan hylätä, pienempi vai suurempi kuin 1 %?

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

Johdatus tilastotieteeseen Tilastollinen riippuvuus ja korrelaatio. TKK (c) Ilkka Mellin (2004) 1

n = 100 x = %:n luottamusväli µ:lle Vastaus:

voidaan hylätä, pienempi vai suurempi kuin 1 %?

Ongelma: Poikkeaako perusjoukon suhteellinen osuus vertailuarvosta?

MTTTP1, luento KERTAUSTA

MTTTP1, luento KERTAUSTA

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

Kandidaatintutkielman aineistonhankinta ja analyysi

LIITTEET Liite A Stirlingin kaavan tarkkuudesta...2. Liite B Lagrangen kertoimet...3

( ) k 1 = a b. b 1) Binomikertoimen määritelmän mukaan yhtälön vasen puoli kertoo kuinka monta erilaista b-osajoukkoa on a-joukolla.

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Luennot, osa II

χ 2 -yhteensopivuustesti

Osa 2: Otokset, otosjakaumat ja estimointi

Mat Tilastollisen analyysin perusteet, kevät 2007

OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi Luento 2

Todennäköisyys, että yhden minuutin aikana saapuu 2 4 autoa.

8. laskuharjoituskierros, vko 11, ratkaisut

Johdatus tilastotieteeseen Otos ja otosjakaumat. TKK (c) Ilkka Mellin (2004) 1

Kaksiulotteinen normaalijakauma Mitta-asteikot Havaintoaineiston kuvaaminen ja otostunnusluvut

4 KORKEAMMAN KERTALUVUN LINEAARISET DIFFERENTIAALIYHTÄLÖT. Kertaluvun n lineaarinen differentiaaliyhtälö ns. standardimuodossa on

S Laskennallinen systeemibiologia

MTTTP1, luento KERTAUSTA

r = n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit.

χ 2 -yhteensopivuustesti

Sisällysluettelo ESIPUHE KIRJAN 1. PAINOKSEEN...3 ESIPUHE KIRJAN 2. PAINOKSEEN...3 SISÄLLYSLUETTELO...4

Kvantitatiiviset menetelmät

BIOSTATISTIIKKAA ESIMERKKIEN AVULLA. Kurssimoniste (luku 4) Janne Pitkäniemi. Helsingin Yliopisto Kansanterveystieteen laitos

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

SPSS ohje. Metropolia Business School/ Pepe Vilpas

Johdatus tilastotieteeseen Otos ja otosjakaumat. TKK (c) Ilkka Mellin (2005) 1

Kvantitatiiviset menetelmät

Mat Tilastollisen analyysin perusteet, kevät 2007

HY, MTL / Matemaattisten tieteiden kandiohjelma Todennäköisyyslaskenta IIb, syksy 2018 Harjoitus 3 Ratkaisuehdotuksia.

TUTKIMUSOPAS. SPSS-opas

Tilastotieteen perusteet

Tulkitse tulokset. Onko muuttujien välillä riippuvuutta? Jos riippuvuutta on, niin millaista se on?

Tilastollisten aineistojen kuvaaminen. Tilastollisten aineistojen kuvaaminen. Tilastollisten aineistojen kuvaaminen: Mitä opimme?

Tilastollinen päättömyys, kevät 2017 Harjoitus 6A

TA7, Ekonometrian johdantokurssi HARJOITUS 4 1 RATKAISUEHDOTUKSET

1. Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet

= true C = true) θ i2. = true C = false) Näiden arvot löydetään kuten edellä Kun verkko on opetettu, niin havainto [x 1

Mat Sovellettu todennäköisyyslasku A

Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen., jos otoskeskiarvo on suurempi kuin 13,96. Mikä on testissä käytetty α:n arvo?

Sovellettu todennäköisyyslaskenta B

1.Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet

Regressioanalyysi. Vilkkumaa / Kuusinen 1

Tilastollinen riippuvuus ja korrelaatio

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170

Tilastolliset menetelmät: Tilastolliset testit

Yhden selittäjän lineaarinen regressiomalli

Kynä-paperi -harjoitukset. Taina Lehtinen Taina I Lehtinen Helsingin yliopisto

Otantajakauma. Otantajakauman käyttö päättelyssä. Otantajakauman käyttö päättelyssä

χ = Mat Sovellettu todennäköisyyslasku 11. harjoitukset/ratkaisut

SMG-4200 Sähkömagneettisten järjestelmien lämmönsiirto Ehdotukset harjoituksen 6 ratkaisuiksi

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Sisällysluettelo ESIPUHE... 4 ALKUSANAT E-KIRJA VERSIOON... 5 SISÄLLYSLUETTELO JOHDANTO TILASTOLLISEEN PÄÄTTELYYN TODENNÄKÖISYYS...

EX1 EX 2 EX =

Tilastollinen todennäköisyys

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

811312A Tietorakenteet ja algoritmit II Algoritmien analyysi

Testit suhdeasteikollisille muuttujille. Testit suhdeasteikollisille muuttujille. Testit suhdeasteikollisille muuttujille: Esitiedot

xi = yi = 586 Korrelaatiokerroin r: SS xy = x i y i ( x i ) ( y i )/n = SS xx = x 2 i ( x i ) 2 /n =

Tilastollinen testaaminen tai Tilastollinen päättely. Geneettinen analyysi

Testit laatueroasteikollisille muuttujille. Testit laatueroasteikollisille muuttujille. Testit laatueroasteikollisille muuttujille: Esitiedot

Tilastollinen päättömyys, kevät 2017 Harjoitus 5b

Regressioanalyysi. Kuusinen/Heliövaara 1

Tehtäviä neliöiden ei-negatiivisuudesta

Algebra I Matematiikan ja tilastotieteen laitos Ratkaisuehdotuksia harjoituksiin 5 (6 sivua)

Lumipallo regressioanalyysista. Logistinen regressioanalyysi. Soveltuvan menetelmän valinta. Regressioanalyysi. Logistinen regressioanalyysi I

Normaalijakaumasta johdettuja jakaumia. Normaalijakaumasta johdettuja jakaumia. Normaalijakaumasta johdettuja jakaumia: Mitä opimme?

3 Lukujonot matemaattisena mallina

Mat Tilastollisen analyysin perusteet, kevät 2007

5. Kahden tunnusluvun erotuksen merkitsevyys

KURSSIKYSELYAINEISTO: HUOM! Aineiston tilastoyksikkömäärä 11 on kovin pieni oikean tilastotieteen tekemiseen, mutta Harjoitteluun se kelpaa kyllä!

Mat Tilastollisen analyysin perusteet, kevät 2007

Tilastotieteen perusteet

Väliestimointi (jatkoa) Heliövaara 1

Insinöörimatematiikka IA

5.3 Matriisin kääntäminen adjungaatilla

Tehtävä 1. Voidaanko seuraavat luvut esittää kahden neliön summina? Jos voidaan, niin kuinka monella eri tavalla? (i) n = 145 (ii) n = 770.

Aritmeettinen jono

Kaavakokoelma, testikaaviot ja jakaumataulukot liitteinä. Ei omia taulukoita! Laskin sallittu.

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

Transkriptio:

Moimuuttujameetelmät Kvatitatiiviset meetelmät Sami Fredriksso Yleie valtio-oppioppi Mikko Mattila 009 1 Yhde muuttuja meetelmät (uivariate statistics): keskiluvut ja hajotaluvut Moimuuttujameetelmät: kahde (bivariate) tai useamma (multivariate) muuttuja väliste suhteide tarkastelu Useimmite meetelmissä oletetaa kausaaliasetelma (esim. regressioaalyysi) Aia ei tarvitse tehdä tätä oletusta (esim. korrelaatiokertoimet, ryhmittelyaalyysi) Soveltuva meetelmä riippuu muuttujie mittaustasosta Mikko Mattila 009 Soveltuva meetelmä valita SELITTÄVÄ MUUTTUJA Laatuero- tai järjestysasteikko Välimatka- tai suhdelukuasteikko SELITETTÄVÄ MUUTTUJA Laatuero- tai järjestysasteikko - Ristiitaulukoiti - Log-lieaariset mallit - Logistie regressio - Multiomiaalie regressio Välimatka- tai suhdelukuasteikko -Variassiaalyysi -Regressioaalyysi Korrelaatiokertoimet Korrelaatio kuvastaa kahde muuttuja välise lieaarise riippuvuude astetta Voimakas korrelaatio tarkoittaa sitä, että tiedettäessä toise muuttuja arvo, voidaa toise muuttuja arvo päätellä melko täsmällisesti Soveltuva korrelaatiokertoime valita riippuu muuttujie mittaustasosta Vaihtoehtoia esim.: Pearsoi tulomometti- korrelaatiokerroi, kotigessikerroi, Yule Q, phi, Crameri V, lambda, epävarmuuskerroi, Spearmai rho Mikko Mattila 009 3 Mikko Mattila 009 4 Tulomomettikorrelaatiokerroi Pearsoi tulomomettikorrelaatiokerroi o yleisimmi käytetty kerroi Soveltuu kahde vähitää välimatka- asteikollise muuttuja lieaarise riippuvuude tarkasteluu Merkitää r xy Arvo vaihtelee välillä 1 +1 Tulomomettikorrelaatiokerroi Huomioitavia seikkoja: korrelaatiokerroi o symmetrie eli r xy =r yx korrelaatio ei kerro mitää kausaalisuudesta jos muuttujie välillä epälieaarie suhde, korrelaatiokerroi ei välttämättä mittaa sitä yksittäiset poikkeavat havaitoarvot voivat vaikuttaa kertoimee vääristäe tulosta korrelaatiokertoime tilastollise merkitsevyyde arvioiti tärkeää Mikko Mattila 009 5 Mikko Mattila 009 6 1

D1 LEFT-RIGHT PLACEMET D11 AGE EXACT D ICOME HH - FI Correlatios **. Correlatio is sigificat at the 0.01 level (-tailed). Korrelaatiokerroi p: arvo D1 LEFT-RIGHT D11 AGE D ICOME PLACEMET EXACT HH - FI 1.000 -.039.197**..47.000 86 86 810 -.039 1.000 -.15**.47..000 86 10 95.197** -.15** 1.000.000.000. 810 95 95 Osittaiskorrelaatiokerroi Osittaiskorrelaatiokerroi kertoo kahde muuttuja riippuvuude ku yhde tai useamma muu muuttuja vaikutus o poistettu (vakioitu) Merkitää r xy.z Esim. jäätelö kulutus ja hukkumiskuolemat korreloivat vahvasti, mutta iide osittaiskorrelaatiokerroi o olla, ku lämpötila o vakioitu Osittaiskorrelaatiokerroita käytetää suhteellise harvoi, koska sama iformaatio saadaa regressioaalyysi avulla kätevämmi Mikko Mattila 009 7 Mikko Mattila 009 8 Spearmai järjestyskorrelaatio Periaatteessa tarkoitettu järjestysasteikollisille muuttujille, mutta usei järkevää käyttää myös korkeammalla mittaustasolla Molempie muuttujie havaioille aetaa uudet arvot ii, että piei saa arvo yksi, toiseksi piei kaksi je. Lasketaa tavallie Pearsoi korrelaatiokerroi järjestysluvuista Spearmai korrelaatiokerroi ei ole yhtä herkkä poikkeamille lieaarisuudesta kui Pearsoi kerroi Ristiitaulukoiti Ristiitaulukoitia käytetää tutkittaessa kahde tai useamma muuttuja jakaumaa ja keskiäistä riippuvuutta Muuttujat mitattu joko luokittelu- tai järjestysasteikolla Usei käytetää myös välimatka- tai suhdeasteiko muuttujia, mutta e o esi luokiteltava Tutkitaa, oko tarkastelu kohteea oleva selitettävä muuttuja jakauma erilaie selittävä muuttuja eri luokissa Mikko Mattila 009 9 Mikko Mattila 009 10 : keskusteluaktiivisuus : eroavatko miehet ja aiset toisistaa siiä, kuika usei he keskustelevat politiikasta ystäviesä kassa? Absoluuttise lukumäärät eivät osoita suoraa sukupuolie välisiä eroja o laskettava prosettijakaumat Mies aie Silloi tällöi E koskaa 33 8 108 : keskusteluaktiivisuus Taulukko. Aktiivisuus keskustella poliittisista asioita ystävie kassa sukupuole mukaa (%). Mies aie Usei 9 6 Silloi tällöi 68 60 E koskaa 3 35 () =18,4; vapausasteita=; p<0,01 () (501) Mikko Mattila 009 11 Mikko Mattila 009 1

Prosettijakaumie oikea suuta Ristiitaulukkoa tehdessä o tärkeää laskea prosettijakaumat oikeaa suutaa Prosetit lasketaa selittävä muuttuja luokissa Viime kädessä tutkimusogelma ratkaisee suua Ristiitauluko esittämie Tavaomaie ratkaisu: selittävä muuttuja sarakkeille, selitettävä riveille Taulukkoo tulee liittää yhteelasketut tiedot proseteista, koska e helpottavat tulkitaa Tapauste lukumäärät () ilmoitettava Taulukossa ilmoitettava tilastollise testi tulos Mikko Mattila 009 13 Mikko Mattila 009 14 Ristiitauluko merkitsevyyde testaus Voidaako otokse tuloste perusteella päätellä tarpeeksi luotettavasti, että havaitut erot pätevät myös perusjoukossa? Testausmeetelmää - riippumattomuustesti ( khii-toisee ) Perustuu havaittuje ja odotettuje frekvessie erotukselle Ristiitauluko merkitsevyyde testaus ollahypoteesi: ei eroja selitettävä muuttuja eri luokissa Jos p-arvo o riittävä piei, voidaa päätellä, että erot ovat tilastollisesti merkitsevät Huom.: tilastollie merkitsevyys eri asia kui sisällöllisesti tärkeä ero Mikko Mattila 009 15 Mikko Mattila 009 16 Ristiitauluko elaboraatio Löydettyä kausaali- suhdetta täsmee- tää ja varmee- taa tuomalla aalyysii uusia muuttujia Alle 35 v. 35-59 v. 60 v. täyttäeet M M M Usei 4 10 8 17 9 Silloi tällöi E koskaa () 64 58 71 6 59 33 40 19 31 11 3 (183) (184) =,8; vapausast.=; p=0,4 (194) (199) =7,8; vapausast.=; p=0,0 (96) (118) =14,4; vapausast.=; p<0,01 Mies aie 8 61 8 3 % % % ollahypoteesi: ei eroja selitettävä muuttuja eri luokissa Tarvitaa tieto odotetuista frekvesseistä Mikko Mattila 009 17 Mikko Mattila 009 18 3

3 % Mies aie % 8 61 8 % Odotetut frekvessit saadaa kaavasta: E Oi O. Mikko Mattila 009 19 ij. Eij = odotettu frekvessi Oi. = i: rivi kokoaissumma O.j = j: sarakkee kokoaissumma = havaitoje määrä Esim. (61*)/975 = j 3 % Mies aie % 8 61 8 % -testisuure saadaa kaavasta: R C ( Oij Eij E ) Eli: i1 j1 (43-) / + (-) / + (-) / =18,4 Mikko Mattila 009 0 ji -testisuure sai esimerkissä arvo 18,4 Sitä vastaava p-arvo tietämiseksi tarvitaa vielä tieto tauluko vapausasteista (degrees of freedom, d.f.) Se saadaa kaavasta: (rivie määrä 1 )*(sarakkeide määrä 1) Vapausasteet o siis (3-1)*(-1)=1)= Ku tiedetää -luku ja vapausasteet, p-arvo voidaa etsiä tilastollisesta -jakaumataulukosta Oeksi tätä ei tarvitse tehdä käsi vaa SPSS- ohjelma laskee kaike automaattisesti Mikko Mattila 009 1 Mikko Mattila 009 -luku Tutkitaa suomalaiste poliittise sijoittumise ja EU-kaatukse suhdetta ristiitaulukoiilla Poliittise sijoittumise alkuperäie skaala (1-10) o uudelleekoodattu seuraavasti: 1-4 = vasemmisto 5-6 = keskusta 7-10 = oikeisto EU-kysymyksessä kysytty o Suome jäseyys EU:ssa mielestäsi 1) Hyvä asia, ) Huoo asia, 3) Ei hyvä eikä huoo asia Vapausasteet * D1 LEFT-RIGHT PLACEMET -RECODED Crosstabulatio Value df (-sided) 5.991 a 4.000 5.790 4.000 10.345 1.001 87 a. 0 cells (.0%) have expected cout less tha 5. The miimum expected cout is 51.00. p: arvo D1 LEFT-RIGHT PLACEMET -RECODED (1-4) Left (5-6) Cetre (7-10) Right 78 116 134 38 PLACEMET -RECODED 36.6% 3.4% 5.3% 39.7% 54 97 47 198 PLACEMET -RECODED 5.4% 7.1% 18.4% 3.9% either good or bad 81 145 75 301 PLACEMET -RECODED 38.0% 40.5%.3% 36.4% 13 358 56 87 PLACEMET -RECODED.0%.0%.0%.0% Mikko Mattila 009 3 Mikko Mattila 009 4 4

Male Female Value df (-sided) 19.83 a 4.001 19.441 4.001 5.311 1.01 379 14.068 b 4.007 13.80 4.008 5.01 1.03 448 a. 0 cells (.0%) have expected cout less tha 5. The miimum expected cout is 6.89. b. 0 cells (.0%) have expected cout less tha 5. The miimum expected cout is 4.1. Seuraavaksi tutkitaa oko poliittise sijoittumise ja EUkaatukse suhde samalaie miehillä ja aisilla eli tehdää ristiitauluko elaboroiti Mikko Mattila 009 5 * D1 LEFT-RIGHT PLACEMET -RECODED * Crosstabulatio D1 LEFT-RIGHT PLACEMET -RECODED (1-4) Left (5-6) Cetre (7-10) Right Male 47 49 78 PLACEMET -RECODED 4.0% 36.3% 59.1% 45.9% 34 31 6 91 PLACEMET -RECODED 30.4% 3.0% 19.7% 4.0% either good or bad 31 55 8 114 PLACEMET -RECODED 7.7% 40.7% 1.% 30.1% 11 135 13 379 PLACEMET -RECODED.0%.0%.0%.0% Female 31 67 56 154 PLACEMET -RECODED 30.7% 30.0% 45.% 34.4% 0 66 1 107 PLACEMET -RECODED 19.8%.6% 16.9% 3.9% either good or bad 50 90 47 187 PLACEMET -RECODED 49.5% 40.4% 37.9% 41.7% 101 3 14 448 PLACEMET -RECODED.0%.0%.0%.0% Mikko Mattila 009 6 Edellise tauluko mukaa vaikuttaisi siltä, että aiset suhtautuvat EU:hu miehiä epäileväisemmi poliittisesta sijoittumisesta riippumatta tehdää tästä oma taulukko Value df (-sided) 15.310 a.000 15.348.000 15.09 1.000 964 a. 0 cells (.0%) have expected cout less tha 5. The miimum expected cout is 106.86. * Crosstabulatio Q17 EU MEMBERSH either good or b Female Male 188 1 360 43.6% 3.3% 37.3% 105 134 39 4.4% 5.1% 4.8% 138 7 365 3.0% 4.6% 37.9% 431 533 964.0%.0%.0% Mikko Mattila 009 7 Mikko Mattila 009 8 Seuraavaksi tutkitaa, pysyykö sukupuolie erot EU- kaatuksessa samalaisia ku vakioidaa vastaajie poliittie sijoittumie: D1 LEFT-RIGHT PLACEMET -RECODED (1-4) Left (5-6) Cetre (7-10) Right a. b. c. Value 10.8 a.004 10.907.004 5.61. 36.58. 7.759 1.005 13.383 b.304.400.301.400 1.57 358 8.716 c.013 8.777.01 7.83 1.005 56.77. Mikko Mattila 009 df (-sided) * * D1 LEFT-RIGHT PLACEMET -RECODED Crosstabulatio D1 LEFT-RIGHT PLACEMET -RECODED (1-4) Left (5-6) Cetre (7-10) Right either good or bad either good or bad either good or bad Male Female 47 31 78 4.0% 30.7% 36.6% 34 0 54 30.4% 19.8% 5.4% 31 50 81 7.7% 49.5% 38.0% 11 101 13.0%.0%.0% 49 67 116 36.3% 30.0% 3.4% 31 66 97 3.0%.6% 7.1% 55 90 145 40.7% 40.4% 40.5% 135 3 358.0%.0%.0% 78 56 134 59.1% 45.% 5.3% 6 1 47 19.7% 16.9% 18.4% 8 47 75 1.% 37.9%.3% 13 14 56.0%.0%.0% Mikko Mattila 009 30 5