MIKSI SEKOITTUMISELLE EI OLE OLEMASSA TILASTOLLISTA TESTIÄ, MIKSI MONET USKOVAT ETTÄ ON JA MIKSI HE OVAT LÄHES OIKEASSA

Samankaltaiset tiedostot
4.0.2 Kuinka hyvä ennuste on?

3 Yleistä estimointiteoriaa. Olemme perehtuneet jo piste-estimointiin su-estimoinnin kautta Tässä luvussa tarkastellaan piste-estimointiin yleisemmin

Regressioanalyysi. Vilkkumaa / Kuusinen 1

Olkoon seuraavaksi G 2 sellainen tasan n solmua sisältävä suunnattu verkko,

3.6 Su-estimaattorien asymptotiikka

pitkittäisaineistoissa

Mat Tilastollisen analyysin perusteet, kevät 2007

Johdatus tn-laskentaan perjantai

Testit laatueroasteikollisille muuttujille

Kausaalisuus ja kausaalipäättely. Pertti Töttö

Sovellettu todennäköisyyslaskenta B

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?

Testejä suhdeasteikollisille muuttujille

Toispuoleiset raja-arvot

MTTTP5, luento Otossuureita ja niiden jakaumia (jatkuu)

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

1. Tutkitaan regressiomallia Y i = β 0 + β 1 X i + u i ja oletetaan, että tavanomaiset

1. Tilastollinen malli??

Kausaalimallien kontrafaktuaalit. Paula Silvonen

Osa 2: Otokset, otosjakaumat ja estimointi

Mitä kausaalivaikutuksista voidaan päätellä havainnoivissa tutkimuksissa?

tilastotieteen kertaus

Regressioanalyysi. Kuusinen/Heliövaara 1

Aineistoista. Laadulliset menetelmät: miksi tarpeen? Haastattelut, fokusryhmät, havainnointi, historiantutkimus, miksei videointikin

Martingaalit ja informaatioprosessit

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 6. luento. Pertti Palo

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. Luentokuulustelujen esimerkkivastauksia. Pertti Palo. 30.

Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi

1 + b t (i, j). Olkoon b t (i, j) todennäköisyys, että B t (i, j) = 1. Siis operaation access(j) odotusarvoinen kustannus ajanhetkellä t olisi.

Tilastotieteen kertaus. Kuusinen/Heliövaara 1

pitkittäisaineistoissa

Todennäköisyyslaskun kertaus. Vilkkumaa / Kuusinen 1

Mat Tilastollisen analyysin perusteet, kevät 2007

Jos nyt on saatu havaintoarvot Ü ½ Ü Ò niin suurimman uskottavuuden

Tilastollinen aineisto Luottamusväli

Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Tilastollinen päättely II, kevät 2017 Harjoitus 1A

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Estimointi populaation tuntemattoman parametrin arviointia otossuureen avulla Otossuure satunnaisotoksen avulla määritelty funktio

Tehtäväsarja I Tehtävät 1-5 perustuvat monisteen kappaleisiin ja tehtävä 6 kappaleeseen 2.8.

w + x + y + z =4, wx + wy + wz + xy + xz + yz =2, wxy + wxz + wyz + xyz = 4, wxyz = 1.

Sallitut apuvälineet: MAOL-taulukot, kirjoitusvälineet, laskin sekä itse laadittu, A4-kokoinen lunttilappu. f(x, y) = k x y, kun 0 < y < x < 1,

Väliestimointi (jatkoa) Heliövaara 1

6. laskuharjoitusten vastaukset (viikot 10 11)

3 Yleistä estimointiteoriaa. Olemme perehtuneet jo piste-estimointiin su-estimoinnin kautta Tässä luvussa tarkastellaan piste-estimointiin yleisemmin

Harjoitus 7: NCSS - Tilastollinen analyysi

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

Johdatus tilastotieteeseen Tilastollisten aineistojen kerääminen ja mittaaminen. TKK (c) Ilkka Mellin (2005) 1

Tilastollisia peruskäsitteitä ja Monte Carlo

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu

Ratkaisu: a) Kahden joukon yhdisteseen poimitaan kaikki alkiot jotka ovat jommassakummassa joukossa (eikä mitään muuta).

Sovellettu todennäköisyyslaskenta B

ABHELSINKI UNIVERSITY OF TECHNOLOGY

Nimitys Symboli Merkitys Negaatio ei Konjuktio ja Disjunktio tai Implikaatio jos..., niin... Ekvivalenssi... jos ja vain jos...

Todennäköisyyden ominaisuuksia

Matematiikan tukikurssi, kurssikerta 2

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2005) 1

Tilastollisten aineistojen kerääminen ja mittaaminen

Batch means -menetelmä

Tutkimustiedonhallinnan peruskurssi

verkkojen G ja H välinen isomorfismi. Nyt kuvaus f on bijektio, joka säilyttää kyseisissä verkoissa esiintyvät särmät, joten pari

Konsensusongelma hajautetuissa järjestelmissä. Niko Välimäki Hajautetut algoritmit -seminaari

Sovellettu todennäköisyyslaskenta B

Ilkka Mellin Todennäköisyyslaskenta Osa 3: Todennäköisyysjakaumia Moniulotteisia todennäköisyysjakaumia

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

Tehtävä 1. Arvioi mitkä seuraavista väitteistä pitävät paikkansa. Vihje: voit aloittaa kokeilemalla sopivia lukuarvoja.

Harjoitukset 3 : Monimuuttujaregressio 2 (Palautus )

HAVAITUT JA ODOTETUT FREKVENSSIT

l (φ; y) = l(θ(φ); y) Toinen derivaatta saadaan tulon derivaatan laskusäännöllä Uudelleenparametroidun mallin Fisherin informaatio on

Tehtäväsarja I Seuraavissa tehtävissä harjoitellaan erilaisia todistustekniikoita. Luentokalvoista 11, sekä voi olla apua.

Esko Turunen MAT Algebra1(s)

2. Uskottavuus ja informaatio

Tässä luvussa mietimme, kuinka paljon aineistossa on tarpeellista tietoa Sivuamme kysymyksiä:

Epäyhtälöt ovat yksi matemaatikon voimakkaimmista

Odotusarvo. Odotusarvon ominaisuuksia Satunnaismuuttujien ominaisuuksia 61

Numeeriset menetelmät TIEA381. Luento 12. Kirsi Valjus. Jyväskylän yliopisto. Luento 12 () Numeeriset menetelmät / 33

Moniulotteisia todennäköisyysjakaumia

P(X = x T (X ) = t, θ) = p(x = x T (X ) = t) ei riipu tuntemattomasta θ:sta. Silloin uskottavuusfunktio faktorisoituu

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1

isomeerejä yhteensä yhdeksän kappaletta.

Testit järjestysasteikollisille muuttujille

Tilastollisen analyysin perusteet Luento 6: Korrelaatio ja riippuvuus tilastotieteessä

BM20A5840 Usean muuttujan funktiot ja sarjat Harjoitus 7, Kevät 2018

Viikko 2: Ensimmäiset ennustajat Matti Kääriäinen

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Jokaisen parittoman kokonaisluvun toinen potenssi on pariton.

Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus KE (2014) 1

Kertausluento. Tilastollinen päättely II - 2. kurssikoe

= 5! 2 2!3! = = 10. Edelleen tästä joukosta voidaan valita kolme särmää yhteensä = 10! 3 3!7! = = 120

Erityiskysymyksiä yleisen lineaarisen mallin soveltamisessa

Martingaalit ja informaatioprosessit

3.7 Todennäköisyysjakaumia

Matematiikan tukikurssi, kurssikerta 3

Johdatus regressioanalyysiin. Heliövaara 1

1. Tarkastellaan esimerkissä 4.9 esiintynyttä neliön symmetriaryhmää

Dynaamiset regressiomallit

Transkriptio:

MIKSI SEKOITTUMISELLE EI OLE OLEMASSA TILASTOLLISTA TESTIÄ, MIKSI MONET USKOVAT ETTÄ ON JA MIKSI HE OVAT LÄHES OIKEASSA Jaakko Kuorikoski Kausaalimallien tutkimusseminaari 26.2.2003

1. Sekoittuminen Sekoittuminen on ehkäpä perustavin ongelma, joka estää ongelmattoman päättelyn tilastollisesta riippuvuudesta kausaalisuhteeseen. Jos tavoitteena on määrittää tekijän (kausaalinen) vaikutus toiseen tekijään tarkastelemalla näiden tekijöiden välistä tilastollista riippuvuutta, niin kolmannen tekijän vaikuttaessa näihin kumpaankin tekijään ovat arviot kausaalisesta vaikutuksesta harhaisia, sekoittuneita. Ts. X ja Y ovat sekoittuneita, jos on olemassa muuttuja Z, joka vaikuttaa sekä X:ään että Y:hyn. Z on tällöin X:n ja Y:n sekoittaja. Esimerkiksi R. A. Fisherin kuuluisa argumentti tupakoinnin haitallisuutta vastaan perustui sekoittumisen mahdollisuudelle; vaikka tupakointi ja keuhkosyöpä korreloivatkin vahvasti, ei tästä voida tehdä kausaalisia johtopäätöksiä, koska on mahdollista, että tupakoinnilla ja keuhkosyövällä on yhteinen altistava (geneettinen) tekijä. Tarkastellaan seuraavaa yksinkertaista esimerkkiä sekoittumisesta, joka voisi kuvata Fisherin esittämää tilannetta: b Z c X a Y U 1 U 2 X = bx + U 1 Y = ax + cz + U 2, missä rakenteelliset parametrit (a,b ja c) kuvaavat kausaalisen vaikutuksen vahvuutta eli seuraus-muuttujan muutoksen suhdetta interventiolla aikaansaatuun syy-muuttujan muutokseen (a = E[Y do(x)]/ x jne.). Kyseisessä tapauksessa (olettaen, että virhetermit ovat normaalisti jakautuneita) a:n harhattoman estimaattorin voidaan osoittaa olevan osittaisregressiotekijä r YX. Z, joka saadaan X:n kertoimesta tehtäessä Y:n regressio X:llä ja Z:lla (y = αx + βz + u, missä α = r YX. Z ). Pelkkä X:n regressiokerroin Y:lle on näin harhainen estimaattori rakenteellisesta parametrista a, ja harhan suunta riippuu b:stä ja c:stä. 1

Miksi sekoittumiselle ei ole olemassa puhtaasti tilastollista testiä? Tähän kysymykseen voidaan vastata hyvin lyhyesti: koska sekoittuminen on kausaalinen käsite, on sillä näin muuttujien aktuaalisten jakaumien ylittävää kontrafaktuaalista tai modaalista sisältöä. Jos muuttaisimme interventiolla sekoittavan muuttujan arvoa, muuttuisi sekoitettujen muuttujien yhteisjakauma jollakin tavalla. Vaikka kausaalikäsitteiden eksplisiittistä käyttöä karsastetaankin yleisesti tilastollisia menetelmiä käyttävien tieteiden piirissä, on sekoittumisen mahdollisuus huomioitava jollakin tavoin. Pearlin projektina onkin antaa sekoittumiselle täsmällinen määritelmä eksplisiittisesti kausaalisia käsitteitä hyväksikäyttäen ja selvittää, millainen aineistoa edeltävä kausaalinen informaatio mahdollistaa sekoittumisen tilastollisen testaamisen. Lähtökohta on seuraava, kirjallisuudessa yleisesti hyväksytty kriteeri: Riippumattomuuskriteeri: Muuttujat X ja Y eivät ole sekoittuneet, joss jokainen muuttuja Z, johon X ei vaikuta, on joko (E1) (E2) riippumaton X:stä tai riippumaton Y:stä, ehdollistettuna X:llä. Riippuvuudella ei tässä ole kausaalisia konnotaatioita, vaan se tulee ymmärtää puhtaasti tilastollisena suhteena. Riippumattomuuskriteeri ei kuitenkaan ole puhtaasti tilastollinen, koska siinä esiintyvä ehto, jonka mukaan X ei vaikuta Z:aan, on kausaalinen. Pearlin tuloksena on, että riippumattomuuskriteeri ei ole riittävä eikä välttämätön ehto kausaalisten vaikutusten harhattomille estimaateille. Otettaessa käyttöön vahvempi stabiilin harhattomuuden käsite, voidaan osoittaa yhteys tämän vahvemman harhattomuuden ja sopivalla tavalla muokatun riippumattomuuskriteerin kanssa. 2

2. SEKOITTUMATTOMUUS KAUSAALISENA KÄSITTEENÄ Määritellään aluksi se, mitä haetaan takaa: (SK) Sekoittumattomuus kausaalinen määritelmä Olk. M havainnot tuottavan prosessin kausaalinen malli. P(y do(x)) on vastetapahtuman Y = y todennäköisyys hypoteettisen intervention X = x tapauksessa mallissa M. X ja Y eivät ole sekoittuneet (mallin M mukaan), joss P(y do(x)) = P(y x), kaikille x ja y. Intuitio SK:n takana on selkeä: jos X:llä ja Y:llä ei ole yhteisiä vaikuttavia tekijöitä, niin silloin X:n ja Y:n välillä ei vallitse ei-kausaalisia päättelysuhteita, joita interventio katkaisisi. Näin P(y x):n kannalta on samantekevää, havaitaanko X:n arvo, vai asetetaanko se interventiolla. P(y do(x)):n voi myös tulkita Y = y:n ehdolliseksi todennäköisyydeksi satunnaistetussa kontrolloidussa kokeessa; satunnaistaminen sulkee pois mahdollisuuden, että yksittäisen koeyksikön ominaisuuksilla X = x ja Y = y olisi yhteinen syy, jolloin X = x ikään kuin asetetaan systeemin ulkopuolelta. Unohdetaan yksinkertaisuuden vuoksi aikaisemmasta esimerkistämme virhetermit, jolloin malli on muotoa X = bz Y = ax + cz. Intervention do(x) jälkeinen malli taas on X = x Y = ax + cz. 3

Nyt E[Y do(x)] = ax + ce[z] (a + c/b)x = E[Y x]. Jos saatavilla on tilastollisen aineiston lisäksi kvalitatiiviset kausaaliset oletukset kiteyttävä kausaalinen kaavio (ts. tiedämme mikä muuttuja vaikuttaa mihinkin), voidaan kausaalisten vaikutusten estimaattoreiden mahdollinen harhattomuus lukea suoraan kaaviosta. Tämä takaovi kriteerin nimeä kantava testi perustuu d-erotus kriteeriin, joka ilmaisee tavan, jolla kausaalisen mallin muuttujien yhteisjakauman tulee suhteutua kausaaliset suhteet ilmaisevaan nuolikaavioon. D erotus kriteeri: Kaavion polku p on d-erotettu solmujoukolla Z, jos ja vain jos i) p sisältää ketjun i => m => j tai haarukan i <= m => j s.e. m kuuluu Z:aan, tai ii) p sisältää käänteisen haarukan (v-rakenteen) i => m <= j s.e. m tai mikään m:n jälkeläisistä ei kuulu Z:aan. Joukko Z d-erottaa X:n Y:stä jos ja vain jos Z d -erottaa kaikki polut X:n solmuista Y:n solmuihin. (Verma & Pearl 1988): Jos Z d-erottaa X:n Y:stä kaaviossa G, niin X on riippumaton Y:stä ehdolla Z kaikissa G:n kanssa yhteensopivissa jakaumissa. Kääntäen, jos Z ei d-erota X:ää ja Y:tä kaaviossa G, niin X ja Y ovat riippuvaisia ehdolla Z lähes kaikissa G:n kanssa yhteensopivissa jakaumissa. D erotus on se taikaliima, joka liittää kausaaliset (funktionaaliset) mallit, mallien generoimat muuttujien yhteisjakaumat ja nuolikaaviot toisiinsa. D erotukseen ja sen intuitiiviseen merkitykseen palataan (toivottavasti) myöhemmin. Tavoitteena on nyt selvittää, milloin kausaalinen vaikutus P(y do(x)) tai vastaava rakenteellinen parametri on estimoitavissa havaittavien muuttujien otosjakaumasta, kun tilanteen kausaalinen kaavio on jo selvillä. 4

Takaovi kriteeri: Muuttujajoukko Z täyttää takaovi-kriteerin suhteessa järjestettyyn muuttujapariin (X,Y) kaaviossa D, jos i) yksikään X:n solmu ei ole X:n kausaalinen jälkeläinen ja ii) Z d-erottaa jokaisen X:n ja Y:n välisen polun, joka sisältää nuolen X:ään. Takaovi-kriteeri yleistyy myös tilanteeseen, jossa X ja Y ovat muuttujajoukkoja. Jos kaaviosta löytyy takaovi-kriteerin täyttävä Z, jonka jakauma tunnetaan, on X:n kausaalinen vaikutus Y:hyn laskettavissa. Takaovi-kriteeriä sovelletaan sekoittumisen tapauksessa seuraavalla tavalla: poimitaan kaaviosta kaikki sellaiset X:n ja Y:n väliset polut, jotka sisältävät nuolen X:ään (kaikki polut, jotka päätyvät X:ään ikäänkuin takaoven kautta). Jos kaikki takaovi-polut sisältävät törmääjän, ts. kaksi nuolta, jotka osoittavat samaan solmuun, ovat X ja Y sekoittumattomia. Tällaisessa tilanteessa mikään muuttujajoukko ei täytä takaovi-kriteeriä, jolloin muita muuttujia ei tarvitse ottaa huomioon arvioitaessa X:n kausaalista vaikutusta Y:hyn. 3. RIIPPUMATTOMUUSKRITEERIN ONGELMAT Käytännössä valmista kausaalista kaaviota ei tietenkään ole saatavilla; aineistoa edeltävä teoria tai koejärjestely on harvoin niin vahva, että muutujien väliset kausaalisuhteet olisivat jo selvillä ja vaikutusten vahvuus ainoa mielenkiinnon kohde. Mielenkiintoista onkin, kuinka pitkälle pelkällä tilastollisella aineistolla päästään. Muotoillaan seuraavaksi täsmällisempi ehdokas tilastolliselle sekoittumattomuuden kriteerille. (SR) Sekoittumattomuus riippumattomuuskriteeri Olk. T muuttujajoukko, johon X ei vaikuta. X ja Y eivät ole sekoittuneet T:n ollessa läsnä, jos kaikille Z T pätee toinen seuraavista ehdoista: 5

(E1) (E2) P(x z) = P(x) P(y z,x) = P(y x) Vastaavasti X ja Y ovat sekoittuneet, jos jokin Z K ei täytä kumpaakaan edellä esitetyistä ehdoista. Kriteerin voidaan sanoa olevan riittävä, jos se ei koskaan virheellisesti luokittele tapausta sekoittumattomaksi. Vastaavasti kriteeri on välttämätön, jos se ei koskaan virheellisesti luokittele tapausta sekoittuneeksi. Pearl osoittaa seuraavien vastaesimerkkien avulla, ettei (SR) ole sen enempää riittävä kuin välttämätönkään. i) Reunajakaumat eivät aina riitä (SR) perustuu yksittäisten tekijöiden huomioon ottamisen vaikutukseen Y:n jakaumaan - jokaista potentiaalista sekoittajamuuttujaa tarkastellaan erikseen. Kuitenkin kaksi muuttujaa voi yhdessä sekoittaa X:n ja Y:n, vaikka kumpikin erikseen tarkasteltuna täyttäisi E1:n tai E2:n. Tarkastellaan seuraavaa tilannetta Z 1 X Z 2 Y Missä Z 1 ja Z 2 ovat riippumattomia kolikonheittoja ja X = 1 joss Z 1 = Z 2 (muuten X = 0) ja Y = 1 joss Z 1 Z 2 (muuten Y = 0). Nyt X ja Y ovat täydellisesti käänteisesti korreloituneita. X ja Y eivät kuitenkaan vaikuta kausaalisesti toisiinsa. Kuitenkin joko pelkän Z 1 :n tai Z 2 :n arvon tietäminen ei muuta X:n tai Y:n jakaumaa (E(X) = E(Y) = ½), joten Z 1 ja Z 2 täyttävät kukin erikseen (SR):n ehdot, ja tapaus (SR):n mukaan virheellisesti sekoittumaton. Esimerkki osoittaa myös, miksi saattaa olla harhaanjohtavaa puhua sekoittajista sekoittumisen sijaan. Sekoittuminen on ensisijaisesti rakenteen piirre, ei yksittäisten kausaalisten tekijöiden ominaisuus tai kyky. 6

ii) Kaikkia potentiaalisia sekoittajia ei tunneta SR nojaa oletukseen, jonka mukaan T sisältää kaikki tapauksen potentiaaliset sekoittajat. Käytännössä tästä ei voida koskaan olla varmoja, joten itse asiassa mikään tilastollinen testi ei voi olla riittävä. Tämä vasta-argumentti on kyllä pätevä, mutta ei ilmeisyydessään kovin rakentava. iii) Kausaalisesti vaikuttamattomat proksit Tarkastellaan seuraavaa tilannetta E Z A X Y missä koulutus E vaikuttaa altistumiseen X, joka vaikuttaa sairauteen Y, johon vaikuttaa lisäksi ikä A. Sekä koulutus ja ikä vaikuttavat lisäksi henkilön omistaman auton tyyppin Z. Koska Z on koulutuksen E indikaattori, on se myös korreloitunut altistumisen X kanssa. Toisaalta Z on myös iän A indikaattori ja siten korreloitunut sairauden Y kanssa. Näin Z rikkoo sekä E1:n, että E2:n. Kuitenkaan henkilön omistaman auton tyyppi ei (oletuksen mukaisesti) vaikuta kausaalisesti sen paremmin altistumiseen kuin sairauteenkaan, joten Z ei ole X:n ja Y:n sekoittaja. Se, että esitetty malli todella täyttää SK:n (P(y x) = P(y do(x))), voidaan osoittaa soveltamalla takaovi-kriteeriä (Z ei d-erota ainoaa polkua X:n ja Y:n välillä, joka sisältää X:ään kohdistuvan nuolen.) Näin SK ei myöskään ole välttämätön ehto (kausaaliselle) sekoittumiselle, ts. vaikka vaikka jokin muuttuja (tai muuttujajoukko) rikkoisi esitetyn tilastollisen riippumattomuuskriteerin (SK), ei tästä voida vielä päätellä, että kyseinen muuttuja olisi sekoittaja. Kyseinen tapaus osoittaa, miten mahdollisten sekoittajien huomioimisessa tulee olla tarkkana, koska jos Z:aa luullaan virheellisesti X:n ja Y:n sekoittajaksi ja otetaan siten huomioon kausaalista vaikutusta estimoitaessa, ovat saadut estimaatit yleensä harhaisia. 7

Edeltävä esimerkki osoitti jälleen kerran varsinaista aineistoa edeltävän kausaalisen informaation korvaamattomuuden; harkittaessa kausaalisten vaikutusten estimaattoreiden ehdollistamista mahdollisilla sekoittajilla, on kyseisten muuttujien kausaalisista ominaisuuksista jo oltava jonkinlainen näkemys. Tämän opetuksen perusteella voidaan tilastollista riippumattomuuskriteeriä yrittää muokata siten, etteivät kausaalisesti vaikuttamattomat proksit enää muodostaisi ongelmaa. Luonnollinen ratkaisu onkin vaatimus, jonka mukaan potentiaalisten sekoittajien on edeltävän tiedon valossa edes mahdollista vaikuttaa kiinnostuksen kohteena oleviin muuttujiin: (SR2) Sekoittumattomuus muokattu riippumattomuuskriteeri Olk. T muuttujajoukko, johon X ei vaikuta, mutta joka voisi mahdollisesti vaikuttaa Y:hyn. X ja Y eivät ole sekoittuneet T:n ollessa läsnä, jos kaikille Z T pätee toinen seuraavista ehdoista: (U1) (U2) P(x z) = P(x) P(y z,x) = P(y x) Vastaavasti X ja Y ovat sekoittuneet, jos jokin Z K ei täytä kumpaakaan edellä esitetyistä ehdoista. Kuitenkaan SR2:kaan ei mahda mitään tilanteille, joissa onnekkaan parametrisaation ansiosta P(y do(x)) = P(y x), vaikka olisikin olemassa muuttua Z, joka rikkoo kumpaakin SR2:n ehdoista. Tarkastellaan ensimmäisen esimerkin mukaista tilannetta, jossa X:n ja Y:n virhetermit ovat kuitenkin korreloituneita ja cov(u 1,u 2 ) = r. Nyt voidaan osoittaa, että nk. standardisoiduilla muuttujilla Y:n regressio X:llä antaa a:n estimaatiksi (a + r + bc). Jos r sattuu olemaan yhtäsuuri kuin bc, tarjoaa yksinkertainen regressio harhattoman estimaatin X:n kausaalisesta vaikutuksesta Y:hyn (a = E[Y do(x)]/ x). X ja Y ovat näin sekoittumattomia, vaikka SR2 toisin väittääkin. Tämä harhattomuus on kuitenkin hyvin kontekstiherkkä ilmiö ja onkin epätodennäköistä, että rakenne pysyisi sekoittumattomana 8

tutkimusasetelmaa muutettaessa (esim. toistettaessa tilastollinen tutkimus uudella populaatiolla). 4. STABIILI SEKOITTUMATTOMUUS Autotyypin ja sairauden tapauksessa sekoittumattomuus on riippumaton mallin parametrien täsmällisistä arvoista. Pearl kutsuu tällaista, suoraan mallin kausaalisesta kaaviosta luettavissa olevaa, parametreista riippumatonta estimaattoreiden harhattomuutta stabiiliksi harhattomuudeksi: (SH) Stabiili harhattomuus Olk. A joukko oletuksia havainnot tuottavasta prosessista ja C A niiden kausaalisten mallien joukko, joka täyttää A:n. X:n kausaalisen vaikutuksen Y:hyn estimaatti on stabiilisti harhaton oletuksella A, jos P(y do(x)) = P(y x) kaikissa M C A. Tällöin vastaavasti X ja Y ovat stabiilisti sekoittumattomat. Määritelmässä esiintyvät oletukset voivat koskea parametreja (esim. nolla-rajoitukset), muuttujien (yleensä virhetermien) jakumia tai kausaalisen mallin konstituoivien funktioiden muotoa (esim. lineaarisuusoletukset). Tarkastellaan seuraavaksi tilannetta, jossa oletukset koskevat ainoastaan kausaalisen kaavion topologista rakennetta - nuolikaavion muotoa. (RSS) Rakenteellisesti stabiili sekoittumattomuus Olk. A D kausaaliseen kaavioon D sisältyvät kausaaliset oletukset. X ja Y ovat stabiilisti sekoittumattomat oletuksella A D, jos P(y do(x)) = P(y x) pätee kaikilla D:n parametrisaatioilla - ts. olivat kaaviota vastaavan mallin funktiot ja virhetermien jakaumat millaisia tahansa. 9

Kun kaavio D ei sisällä kehiä, voidaan takaovi-kriteerin avulla johtaa yksinkertainen riittävä ja välttämätön ehto rakenteellisesti stabiilille sekoittumattomuudelle: (YSP) Yhteisen syyn periaate Olk. A D kausaaliseen kaavioon D sisältyvät kausaaliset oletukset. Muuttujat X ja Y ovat stabiilisti sekoittumattomat oletuksella A D joss X:llä ja Y:llä ei ole yhteisiä kausaalisia esiisiä kaaviossa D. YSP kuitenkin edellyttää jälleen, että täydellinen kausaalinen kaavio on saatavilla. Kaiken lisäksi YSP on niin ilmeinen, että sitä voisi pitää lähes tautologiana (X:llä ja Y:llä ei ole yhteisiä syitä joss niillä ei ole yhteisiä syitä). YSP:n avulla voidaan kuitenkin muotoilla stabiilille rakenteelliselle sekoittumattomuudelle testi, joka edellyttää koko kaavion tuntemisen sijasta vain, että pystymme olettamaan jokaisesta muuttujasta Z sen, että Z ei vaikuta Y:hyn ja vaikuttaako X Z:aan. Yhdessä tilastollisen aineiston kanssa, tarjoaa tämä informaatio Pearlin mukaan välttämättömän kriteerin rakenteellisesti stabiiliille sekoittumattomuudelle: (OSS) Operationaalinen testi stabiilille sekoittumattomuudelle Olk. A Z olettamus, jonka mukaan i) havainnot tuottaa prosessi, joka voidaan mallintaa jollakin kehättömällä mallilla M ja ii) Z on sellainen M:n muuttuja, johon X ei vaikuta, mutta joka voi mahdollisesti vaikuttaa Y:hyn (ts. A Z ei sisällä oletusta, jonka mukaan Z ei vaikuta Y:hyn). Jos Z rikkoo molemmat riippumattomuuskriteerin SR ehdoista U 1 ja U 2, niin X ja Y eivät ole stabiilisti sekoittumattomia oletuksella A Z. Yhdenkin edellä määritellyn Z:n löytäminen riittää siis kumoamaan väitteen, jonka mukaan X ja Y ovat stabiilisti sekoittumattomat. X ja Y voivat kuitenkin edelleen olla sattumalta sekoittumattomat kyseisessä tilanteesssa (ts. tilannetta kuvaavassa mallissa parametrit sattuvat olemaan sellaiset, että kausaalisen vaikutuksen estimaattorin harhattomuus kumoutuu.) 10