Kausaalisuus ja kausaalipäättely. Pertti Töttö

Samankaltaiset tiedostot
Simpsonin paradoksi. arvostelija. Toni Merivuori

Näistä standardoiduista arvoista laskettu keskiarvo on nolla ja varianssi 1, näin on standardoidulle muuttujalle aina.

MIKSI SEKOITTUMISELLE EI OLE OLEMASSA TILASTOLLISTA TESTIÄ, MIKSI MONET USKOVAT ETTÄ ON JA MIKSI HE OVAT LÄHES OIKEASSA

Tilastotieteen aihehakemisto

Näistä standardoiduista arvoista laskettu keskiarvo on nolla ja varianssi 1, näin on standardoidulle muuttujalle aina.

HAVAITUT JA ODOTETUT FREKVENSSIT

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. Luentokuulustelujen esimerkkivastauksia. Pertti Palo. 30.

4.2 Useampi selittävä muuttuja (kertausta)

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

SPSS-pikaohje. Jukka Jauhiainen OAMK / Tekniikan yksikkö

xi = yi = 586 Korrelaatiokerroin r: SS xy = x i y i ( x i ) ( y i )/n = SS xx = x 2 i ( x i ) 2 /n =

Perimmäinen kysymys. Työllistämisen tukitoimien vaikuttavuuden arvioinnista. Mitkä ovat tukitoimen X vaikutukset Y:hyn? Kari Hämäläinen (VATT)

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 6. luento. Pertti Palo

Kausaliteetti. Kausaliteetin käsitek. Singulaarinen ja geneerinen kausaliteetti. Kausaliteetti ja determinismi

Tuhat Suomalaista -tutkimus Apteekkariliitto, Lääkäriliitto ja Lääketietokeskus Syyskuu 2017

A130A0650-K Tilastollisen tutkimuksen perusteet 6 op Tentti / Anssi Tarkiainen & Maija Hujala

Mitä kausaalivaikutuksista voidaan päätellä havainnoivissa tutkimuksissa?

Insinöörimatematiikka D

Kausaliteetin käsitek. Kausaliteetti. Kausaliteetti ja determinismi

Pylväsdiagrammi Suomen kunnat lääneittäin vuonna Piirakkadiagrammi Suomen kunnat lääneittäin vuonna 2003 LKM 14.8% 11.2% 19.7% 4.9% 3.6% 45.

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Mat Tilastollisen analyysin perusteet, kevät 2007

Lisätehtäviä ratkaisuineen luentomonisteen lukuihin 2-4 liittyen

Tuhat suomalaista Apteekkariliitto

Tuhat Suomalaista -tutkimus Hallituksen apteekkilinjaukset, Toukokuu SFS ISO20252 Sertifioitu

Insinöörimatematiikka D

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi. Luento 3

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 9. luento. Pertti Palo

1. Tilastollinen malli??

Tässä harjoituksessa käydään läpi R-ohjelman käyttöä esimerkkidatan avulla. eli matriisissa on 200 riviä (havainnot) ja 7 saraketta (mittaus-arvot)

Isien osuuden kasvattaminen perhevapaista lainsäädännöllisin keinoin STTK

Pikajohdatus bayesilaiseen tilastoanalyysiin ja monimuuttuja-analyysiin

Jalankulkijoiden liukastumiset Liikenneturva 2015

Tilastotiede ottaa aivoon

Kantar TNS:n Suomen Yrittäjien pyynnöstä tekemä mielipidetiedustelu

805306A Johdatus monimuuttujamenetelmiin, 5 op

Teema 5: Ristiintaulukointi

Tuhat Suomalaista Suomen Yrittäjät Joulukuu SFS ISO20252 Sertifioitu

Luentokalvoja tilastollisesta päättelystä. Kalvot laatinut Aki Taanila Päivitetty

AIHE: Demografiset_muutokset

TYÖKALUJA SELKEÄÄN SEKSUAALITERVEYSKASVATUKSEEN TURVATAIDOT

Tuhat Suomalaista Apteekkariliitto Maaliskuu SFS ISO20252 Sertifioitu

Til.yks. x y z

Kausaalipäättelyn uudet menetelmät

Vesillä virkistäytyjien profiilit

Luento 9: Yhtälörajoitukset optimoinnissa

Kandidaatintutkielman aineistonhankinta ja analyysi

Tekijä(t) Vuosi Nro. Arviointikriteeri K E? NA

Kotimaisen median arvostus

TUTKIMUSRAPORTTI. Ikäsyrjintä työelämässä

Vektoreiden A = (A1, A 2, A 3 ) ja B = (B1, B 2, B 3 ) pistetulo on. Edellisestä seuraa

Joukkoliikenteen asiakastyytyväisyystutkimus, mittausjakso 1:2011

Matemaatikot ja tilastotieteilijät

MTTTP5, luento Luottamusväli, määritelmä

Joukkoliikenteen asiakastyytyväisyystutkimus, mittausjakso 3:2011

Näin Suomi kommunikoi 6. Elisa

Työntekijöiden näkemyksiä työhyvinvoinnin kehittämisestä ja yhteistoiminnasta työpaikoilla. Toimihenkilökeskusjärjestö STTK 8.2.

Opiskelija viipymisaika pistemäärä

Ohjeita kvantitatiiviseen tutkimukseen

OPETUSSUUNNITELMALOMAKE

pisteet Frekvenssi frekvenssi Yhteensä

2. Jatkoa HT 4.5:teen ja edelliseen tehtavään: Määrää X:n kertymäfunktio F (x) ja laske sen avulla todennäköisyydet

OPETUSSUUNNITELMALOMAKE

TERVEYSKESKUSTEN AVOSAIRAANHOIDON VASTAANOTTOJEN ASIAKASTYYTYVÄISYYSMITTAUS 2012

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

pitkittäisaineistoissa

Vaikuttavuuden tutkimus sosiaalityössä

IROResearch Oy:n Tuhat suomalaista -tutkimuksen tiedonkeruu tehtiin internetissä IROResearch Oy:n valtakunnalliseen kuluttajapaneeliin.

Yleiskuva. Palkkatutkimus Tutkimuksen tausta. Tutkimuksen tavoite. Tutkimusasetelma

Kaavakokoelma, testikaaviot ja jakaumataulukot liitteinä. Ei omia taulukoita! Laskin sallittu.

Määrällisen aineiston esittämistapoja. Aki Taanila

Til.yks. x y z

Liite 1. Koko aineisto (pääkomponentit: sukupuoli, kertalaisuus, ikä ja vapautumisvuosi). max

NEUVOLOIDEN VASTAANOTTOJEN ASIAKASTYYTYVÄISYYSMITTAUS 2012

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Valtionhallinnon ylin johto numeroin huhtikuussa 2016

Usean selittävän muuttujan regressioanalyysi

Aineistokoko ja voima-analyysi

Aluenopeusrajoituksen muutos ja liikenteen rauhoittamistoimenpiteet Kissanmaalla, Takahuhdissa, yms-kyselyn vastausten koonti

Poissulkemisargumentti. Rakenne ja funktio. Poissulkemisargumentti. Poissulkemisargumentti. Yhteiskuntatieteiden filosofia (Kf270) 7.

sityksiä terveysinformaatiosta

Kehittämisohjelman yritystukien vaikuttavuus

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

Anna tutki: Naisen asema työelämässä

Maj ja Tor Nesslingin säätiö Kysely apurahansaajille Tiivistelmä selvityksen tuloksista

Tuhat Suomalaista Mainonnan neuvottelukunta Joulukuu SFS ISO20252 Sertifioitu

Kertausluento. Tilastollinen päättely II - 2. kurssikoe

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

Ajattelutaitojen interventiosta 1.-luokan oppilaille - pilottitutkimus

54. Tehdään yhden selittäjän lineaarinen regressioanalyysi, kun selittäjänä on määrällinen muuttuja (ja selitettävä myös):

TERVEYSKESKUSTEN AVOSAIRAANHOIDON VASTAANOTTOJEN ASIAKASTYYTYVÄISYYSMITTAUS Kaupunkikohtainen vertailu

806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy (1 α) = 99 1 α = 0.

AIHE: Tyossa_kouluttautuminen

Aluenopeusrajoituksen muutos ja liikenteen rauhoittamistoimenpiteet Viinikassan Nekalassa, yms-kyselyn vastausten koonti

Luento-osuusosuus. tilasto-ohjelmistoaohjelmistoa

Joukkoliikenteen asiakastyytyväisyystutkimus, mittausjakso 1:2012

Suurten kaupunkien terveysasemavertailu 2015

AIHE: Terveyden_mittareita

Perhevapaiden palkkavaikutukset

Transkriptio:

Kausaalisuus ja kausaalipäättely Pertti Töttö

???? Tilastollinen riippuvuus ei ole yhtä kuin kausaalisuus Ei korrelaatiota ilman kausaatiota Näennäiskorrelaatio Suunnattu korrelaatio

Korrelaatio: symmetrinen Havaitseminen havaita lisää todennäköisyyttä X Y

Korrelaatio: symmetrinen havaita Havaitseminen lisää todennäköisyyttä X Y

Kausaatio - epäsymmetrinen Manipuloi syytä, seuraus muuttuu.

Kausaatio - epäsymmetrinen Manipuloi syy seurausta ei muutu.

Kausaalisuuden määritelmä Muutos Jos X on Y:n syy, muuttamalla X:ää voi muuttaa Y:tä, mutta Y:n muuttaminen ei muuta X:ää. X muuttaa Y

Kausaalisuuden määritelmä Muutos Määritelmä - ei edellytä tietoista toimijaa - on kehämäinen (ekalla nuolella määritellään toinen) - käsite on primitiivi (Kant ja rotat) X muuttaa Y

Korrelatiivinen tieto Havaitaan Lähes turhaa, jopa harhaanjohtavaa - lääkärissä käyminen ja sairastaminen - paloautojen määrä ja tuhojen suuruus yhdessä X Y

Kausaalinen tieto Muutos Kaiken toiminnan (pidättymisen, välttämisen, vaikuttamisen, hallinnon, politiikan jne.) välttämätön edellytys X muuttaa Y

Ja miten sitä saadaan?

kausaalipäättelyllä! Muutos Jos X:n muuttaminen muuttaa Y:tä, silloin X on Y:n syy. X muuttaa Y

Kausaalipäättelyllä??? Mitataan opiskelijaryhmän Y (itsetunto) ennen X:ää (Jari Sarasvuon luento) ja sen jälkeen Onko Y = Y jälkeen Y ennen yhtä kuin X:n kausaalinen vaikutus Y:hyn?

Kausaalipäättelyllä??? Mitataan opiskelijaryhmän Y (itsetunto) ennen X:ää (Jari Sarasvuon luento) ja sen jälkeen Onko Y = Y jälkeen Y ennen yhtä kuin X:n kausaalinen vaikutus Y:hyn? Ei ole, vaan mikä on?

Kausaalipäättelyllä??? Mitataan opiskelijaryhmän Y (itsetunto) ennen X:ää (Jari Sarasvuon luento) ja sen jälkeen Onko Y = Y jälkeen Y ennen yhtä kuin X:n kausaalinen vaikutus Y:hyn? Ei ole, vaan tämä: Y jälkeen Y* jälkeen

Kausaalipäättelyllä??? Mitataan opiskelijaryhmän Y (itsetunto) ennen X:ää (Jari Sarasvuon luento) ja sen jälkeen Onko Y = Y jälkeen Y ennen yhtä kuin X:n kausaalinen vaikutus Y:hyn? Ei ole, vaan tämä: Y jälkeen Y* jälkeen Y* = mitä Y olisi ollut, jos X:ää ei olisi ollut

Kausaalipäättely on Y* = mitä Y olisi ollut, jos X:ää ei olisi ollut kontrafaktuaalista päättelyä

RCT-asetelma Y* = mitä Y olisi ollut, jos X:ää ei olisi ollut Y* kontrolliryhmän Y jälkeen

RCT-asetelma Y* = mitä Y olisi ollut, jos X:ää ei olisi ollut Y* kontrolliryhmän Y jälkeen Z X Y

RCT-asetelma Y* = mitä Y olisi ollut, jos X:ää ei olisi ollut Y* kontrolliryhmän Y jälkeen R Z X Y

Satunnaistaminen E(Z X=0) = E(Z X=1) R Z X Y

Tilastollinen vakiointi adjusting, conditioning, controlling, stratifying X:n ja Y:n riippuvuus Z:n luokissa, tasoilla, ositteissa Y = a + b 1 X + b 2 Z + e (lineaarinen erikoistapaus)

Satunnaistaminen R Z X Y

Vakiointi Z e X Y

Vakioinnin ongelma Mitkä Z-muuttujat pitää (kannattaa, on tapana) vakioida? Z e X Y

45 Z-muuttujaa!!!

Vakioi kaikki mahdolliset? Tilastotieteen näkökulmasta ei ole oikeita eikä vääriä kontrollimuuttujia, joten kaikki käy. Mutta miksi kontrolloida ainuttakaan? Miksi jotkut korrelaatiot olisivat näennäisiä? RCT kontrolloi kaikki mahdolliset Z-muuttujat, myös tuntemattomat ja ei-mitatut Kausaalipäättelyn näkökulmasta jotkin muuttujat voivat olla vääriä kontrolleja

Vakioi Z-muuttujat, jotka korreloivat sekä Y:n että X:n kanssa! Miksi? Kausaalipäättelyn kannalta riittämätön tai harhaanjohtava ohje

Z korreloi sekä X:n että Y:n kanssa Z Conditioning on Z removes bias X Y

Z korreloi sekä X:n että Y:n kanssa U 1 Conditioning on Z creates bias Z X Y U 2

Ergo Pitää olla eksplisiittinen kausaalimalli, jonka perusteella voi ratkaista, mitä pitää vakioida halutun efektin identifioimiseksi Pearl: etuovi-kriteeri, takaovi-kriteeri, teelaskenta Wright: polkuanalyysi ( rakenneyhtälömallit)

Polkuanalyysin peruskäsitteet Suora vaikutus Epäsuora vaikutus Kokonaisvaikutus

Polkuanalyysin peruskäsitteet Suora vaikutus Epäsuora vaikutus Kokonaisvaikutus Näennäisvaikutus

Polkuanalyysin peruskäsitteet Z X Y

Suora vaikutus X:n suora vaikutus Y:hyn = b1 Z b2 X b1 Y

Epäsuora vaikutus Lineaarisessa tapauksessa X:n epäsuora vaikutus Y:hyn = b3 b2 Z b3 b2 X b1 Y

Kokonaisvaikutus Lineaarisessa tapauksessa b3 Z X:n kokonaisvaikutus Y:hyn = b1 + b3 b2 = suora + epäsuora vaikutus b2 X b1 Y

Kokonaisvaikutus Lineaarisessa tapauksessa b3 Z X:n kokonaisvaikutus Y:hyn = b1 = suora vaikutus b2 X b1 Y

Näennäisvaikutus Lineaarisessa tapauksessa X:n näennäisvaikutus Y:hyn = b4 b1 = b3 b2 Z b3 b2 X b1 Y X b4 = b1 + b3 b2 Y

Suoran ja kokonaisvaikutuksen kausaalinen ero Z Muuta X:ää yhden yksikön verran, Y muuttuu b1:n verran b3 b2 X b1 Y

Suoran ja kokonaisvaikutuksen kausaalinen ero Z Muuta X:ää yhden yksikön verran, Y muuttuu (b1 + b3 b2):n verran b3 b2 X b1 Y

Suoran ja kokonaisvaikutuksen kausaalinen ero b3 Z b2 Muuta X:ää yhden yksikön verran ja pidä Z muuttumattomana, silloin Y muuttuu suoran vaikutuksen (b1) verran X b1 Y

Miksi miehet saavat parempia graduarvosanoja kuin naiset?

Keskiarvot Naiset Miehet p Tampere 3,97 (n = 3223) Turku 4,12 (n = 1966) Jyväskylä 4,08 (n = 7955) 3,95 (n = 1526) 4,09 (n = 1522) 4.22 (n = 4498).601.476.00000000002

Tieteenala Sukupuoli Keskiarvo N Arts Sciences A+S nainen mies nainen mies nainen mies 7000 2000 2000 2000 9000 4000

Tieteenala Sukupuoli Keskiarvo N Arts nainen 4,0 7000 mies 4,0 2000 Sciences nainen 4,5 2000 mies 4,5 2000 A+S nainen 9000 mies 4000

Simpsonin paradoksi: Tieteenala Sukupuoli Keskiarvo N Arts nainen 4,0 7000 mies 4,0 2000 Sciences nainen 4,5 2000 mies 4,5 2000 A+S nainen 4,11 9000 mies 4,25 4000

Y = 4,0 + 0,5 tieteenala + 0 sukupuoli Tieteenala Sukupuoli Keskiarvo N Arts nainen 4,0 2000 mies 4,0 2000 Sciences nainen 4,5 2000 mies 4,5 2000 A+S nainen 4,25 4000 mies 4,25 4000

gradun arv olause Aine ei ole Tampereella on Tampereella Total sukup nainen mies Total nainen mies Total nainen mies Total Report Mean N Std. Dev iat ion 4,45 1196 1,011 4,63 1240 1,063 4,54 2436 1,042 4,02 6759 1,017 4,07 3258 1,175 4,04 10017 1,071 4,08 7955 1,028 4,22 4498 1,172 4,14 12453 1,084

Otos N = 1221

Otos N = 1221