Gráfico causal

En estadística, econometría, epidemiología, genética y disciplinas relacionadas, los gráficos causales (también conocidos como diagramas de ruta , redes bayesianas causales o DAG) son modelos gráficos probabilísticos que se utilizan para codificar supuestos sobre el proceso de generación de datos.

Los gráficos causales se pueden utilizar para la comunicación y para la inferencia. Como dispositivos de comunicación, los gráficos proporcionan una representación formal y transparente de los supuestos causales que los investigadores pueden desear transmitir y defender. Como herramientas de inferencia, los gráficos permiten a los investigadores estimar los tamaños del efecto a partir de datos no experimentales, ^[1]^[2]^[3]^[4]^[5] derivar implicaciones comprobables de los supuestos codificados, ^[1]^[6]^[7]^[8] probar la validez externa, ^[9] y gestionar los datos faltantes ^[10] y el sesgo de selección. ^[11]

Los gráficos causales fueron utilizados por primera vez por el genetista Sewall Wright ^[12] bajo la rúbrica "diagramas de ruta". Posteriormente fueron adoptados por científicos sociales ^[13]^[14]^[15]^[16]^[17]^[18] y, en menor medida, por economistas. ^[19] Estos modelos se limitaron inicialmente a ecuaciones lineales con parámetros fijos. Los desarrollos modernos han extendido los modelos gráficos al análisis no paramétrico, logrando así una generalidad y flexibilidad que ha transformado el análisis causal en la informática, la epidemiología ^[20] y las ciencias sociales. ^[21]

Construcción y terminología

El gráfico causal se puede dibujar de la siguiente manera. Cada variable en el modelo tiene un vértice o nodo correspondiente y se dibuja una flecha desde una variable X a una variable Y siempre que se juzga que Y responde a cambios en X cuando todas las demás variables se mantienen constantes. Las variables conectadas a Y mediante flechas directas se denominan padres de Y , o "causas directas de Y ", y se indican mediante Pa (Y) .

Los modelos causales a menudo incluyen "términos de error" o "factores omitidos" que representan todos los factores no medidos que influyen en una variable Y cuando Pa (Y) se mantienen constantes. En la mayoría de los casos, los términos de error se excluyen del gráfico. Sin embargo, si el autor del gráfico sospecha que los términos de error de dos variables cualesquiera son dependientes (por ejemplo, las dos variables tienen una causa común latente o no observada), se dibuja un arco bidireccional entre ellas. Así, la presencia de variables latentes se tiene en cuenta a través de las correlaciones que inducen entre los términos de error, representados por arcos bidireccionales.

Herramientas fundamentales

Una herramienta fundamental en el análisis gráfico es la separación d , que permite a los investigadores determinar, mediante inspección, si la estructura causal implica que dos conjuntos de variables son independientes dado un tercer conjunto. En modelos recursivos sin términos de error correlacionados (a veces llamados Markoviano ), estas independientes condicionales representan todas las implicaciones comprobables del modelo. ^[22]

Ejemplo

Suponga que deseamos estimar el efecto de asistir a una universidad de élite sobre los ingresos futuros. La simple regresión de los ingresos en la calificación de la universidad no dará una estimación imparcial del efecto objetivo porque las universidades de élite son muy selectivas y es probable que los estudiantes que asisten a ellas tengan calificaciones para trabajos de altos ingresos antes de asistir a la escuela. Suponiendo que las relaciones causales son lineales, este conocimiento previo se puede expresar en la siguiente especificación del modelo de ecuación estructural (SEM).

Modelo 1

{\ Displaystyle {\ begin {alineado} Q_ {1} & = U_ {1} \\ C & = a \ cdot Q_ {1} + U_ {2} \\ Q_ {2} & = c \ cdot C + d \ cdot Q_ {1} + U_ {3} \\ S & = b \ cdot C + e \ cdot Q_ {2} + U_ {4}, \ end {alineado}}}

dónde ${\ Displaystyle Q_ {1}}$ representa las calificaciones de la persona antes de la universidad, ${\ Displaystyle Q_ {2}}$ representa calificaciones después de la universidad, ${\ Displaystyle C}$ contiene atributos que representan la calidad de la universidad a la que asistió, y ${\ Displaystyle S}$ el salario del individuo.

Figura 1: Modelo no identificado con variables latentes (

{\ Displaystyle Q_ {1}}

y

{\ Displaystyle Q_ {2}}

) mostrado explícitamente

Figura 2: Modelo no identificado con variables latentes resumidas

La Figura 1 es un gráfico causal que representa la especificación de este modelo. Cada variable del modelo tiene un nodo o vértice correspondiente en el gráfico. Además, para cada ecuación, se dibujan flechas de las variables independientes a las variables dependientes. Estas flechas reflejan la dirección de la causalidad. En algunos casos, podemos etiquetar la flecha con su coeficiente estructural correspondiente como en la Figura 1.

Si ${\ Displaystyle Q_ {1}}$ y ${\ Displaystyle Q_ {2}}$ son variables latentes o no observadas, su influencia en ${\ Displaystyle C}$ y ${\ Displaystyle S}$ puede atribuirse a sus términos de error. Al eliminarlos, obtenemos la siguiente especificación de modelo:

Modelo 2

{\ Displaystyle {\ begin {alineado} C & = U_ {C} \\ S & = \ beta C + U_ {S} \ end {alineado}}}

La información de fondo especificada por el Modelo 1 implica que el término de error de ${\ Displaystyle S}$ , ${\ Displaystyle U_ {S}}$ , está correlacionado con el término de error de C , ${\ Displaystyle U_ {C}}$ . Como resultado, agregamos un arco bidireccional entre S y C , como en la Figura 2.

Figura 3: Modelo identificado con variables latentes (

{\ Displaystyle Q_ {1}}

y

{\ Displaystyle Q_ {2}}

) mostrado explícitamente

Figura 4: Modelo identificado con variables latentes resumidas

Desde ${\ Displaystyle U_ {S}}$ está correlacionado con ${\ Displaystyle U_ {C}}$ y por lo tanto, ${\ Displaystyle C}$ , ${\ Displaystyle C}$ es endógeno y ${\ Displaystyle \ beta}$ no se identifica en el Modelo 2. Sin embargo, si incluimos la solidez de la solicitud universitaria de una persona, ${\ Displaystyle A}$ , como se muestra en la Figura 3, obtenemos el siguiente modelo:

Modelo 3

{\ Displaystyle {\ begin {alineado} Q_ {1} & = U_ {1} \\ A & = a \ cdot Q_ {1} + U_ {2} \\ C & = b \ cdot A + U_ {3} \\ Q_ {2} & = e \ cdot Q_ {1} + d \ cdot C + U_ {4} \\ S & = c \ cdot C + f \ cdot Q_ {2} + U_ {5}, \ end {alineado} }}

Al eliminar las variables latentes de la especificación del modelo obtenemos:

Modelo 4

{\ Displaystyle {\ begin {alineado} A & = a \ cdot Q_ {1} + U_ {A} \\ C & = b \ cdot A + U_ {C} \\ S & = \ beta \ cdot C + U_ {S} , \ end {alineado}}}

con ${\ Displaystyle U_ {A}}$ correlacionado con ${\ Displaystyle U_ {S}}$ .

Ahora, ${\ Displaystyle \ beta}$ se identifica y se puede estimar mediante la regresión de ${\ Displaystyle S}$ en ${\ Displaystyle C}$ y ${\ Displaystyle A}$ . Esto se puede verificar utilizando el criterio de puerta única , ^[1]^[23] condición gráfica necesaria y suficiente para la identificación de coeficientes estructurales, como ${\ Displaystyle \ beta}$ , usando regresión.

Referencias

↑ ^a ^b ^c Pearl, Judea (2000). Causalidad . Cambridge, MA: MIT Press.
^ Tian, Jin; Pearl, Judea (2002). "Una condición de identificación general para los efectos causales" . Actas de la Decimoctava Conferencia Nacional de Inteligencia Artificial . ISBN 978-0-262-51129-2.
^ Shpitser, Ilya; Pearl, Judea (2008). "Métodos completos de identificación de la jerarquía causal" (PDF) . Revista de investigación sobre aprendizaje automático . 9 : 1941-1979.
^ Huang, Y .; Valtorta, M. (2006). "Identificabilidad en redes causales bayesianas: un algoritmo sólido y completo". Procedimientos de AAAI .
^ Bareinboim, Elías; Pearl, Judea (2012). "Inferencia causal por experimentos sustitutos: z-identificabilidad". Actas de la vigésimo octava conferencia sobre incertidumbre en inteligencia artificial . arXiv : 1210.4842 . Código bibliográfico : 2012arXiv1210.4842B . ISBN 978-0-9749039-8-9.
^ Tian, Jin; Pearl, Judea (2002). "Sobre las implicaciones comprobables de modelos causales con variables ocultas". Actas de la Decimoctava Conferencia sobre Incertidumbre en Inteligencia Artificial . págs. 519–27. arXiv : 1301.0608 . Código bibliográfico : 2013arXiv1301.0608T . ISBN 978-1-55860-897-9.
^ Shpitser, Ilya; Pearl, Judea (2008). "Independencia durmiente". Procedimientos de AAAI .
^ Chen, Bryant; Pearl, Judea (2014). "Implicaciones comprobables de modelos de ecuaciones estructurales lineales". Procedimientos de AAAI .
^ Bareinmboim, Elías; Pearl, Judea (2014). "Validez externa: del do-cálculo a la transportabilidad entre poblaciones". Ciencia estadística . 29 (4): 579–595. arXiv : 1503.01603 . doi : 10.1214 / 14-pts486 .
^ Mohan, Karthika; Pearl, Judea; Tian, Jin (2013). "Modelos gráficos para inferencia con datos faltantes". Avances en sistemas de procesamiento de información neuronal .
^ Bareinboim, Elías; Tian, Jin; Pearl, Judea (2014). "Recuperación del sesgo de selección en la inferencia causal y estadística". Procedimientos de AAAI .
^ Wright, S. (1921). "Correlación y causalidad". Revista de Investigación Agrícola . 20 : 557–585.
^ Blalock, HM (1960). "Análisis correlacional e inferencias causales" . Antropólogo estadounidense . 62 (4): 624–631. doi : 10.1525 / aa.1960.62.4.02a00060 .
^ Duncan, OD (1966). "Análisis de ruta: ejemplos sociológicos". Revista Estadounidense de Sociología . 72 : 1-16. doi : 10.1086 / 224256 .
^ Duncan, OD (1976). "Introducción a los modelos de ecuaciones estructurales". Revista Estadounidense de Sociología . 82 (3): 731–733. doi : 10.1086 / 226377 .
^ Jöreskog, KG (1969). "Un enfoque general para el análisis confirmatorio del factor de máxima verosimilitud". Psychometrika . 34 (2): 183–202. doi : 10.1007 / bf02289343 .
^ Goldberger, AS; Duncan, OD (1973). Modelos de ecuaciones estructurales en las ciencias sociales . Nueva York: Seminar Press.
^ Goldberger, AS (1972). "Modelos de ecuaciones estructurales en las ciencias sociales". Econometrica . 40 (6): 979–1001. doi : 10.2307 / 1913851 . JSTOR 1913851 .
^ White, Halbert; Chalak, Karim; Lu, Xun (2011). "Vinculación de la causalidad de Granger y el modelo causal de la perla con sistemas configurables". Causalidad en los desafíos de las series temporales en el aprendizaje automático . 5 .
^ Rothman, Kenneth J .; Groenlandia, Sander; Lash, Timothy (2008). Epidemiología moderna . Lippincott Williams y Wilkins.
^ Morgan, SL; Winship, C. (2007). Contrafactuales e inferencia causal: métodos y principios para la investigación social . Nueva York: Cambridge University Press.
^ Geiger, Dan; Pearl, Judea (1993). "Propiedades lógicas y algorítmicas de la independencia condicional". Annals of Statistics . 21 (4): 2001-2021. CiteSeerX 10.1.1.295.2043 . doi : 10.1214 / aos / 1176349407 .
^ Chen, B .; Perla, J (2014). "Herramientas gráficas para el modelado de ecuaciones estructurales lineales". Informe técnico .

[causality-1] Pearl, Judea (2000). Causalidad . Cambridge, MA: MIT Press.

[2] Tian, Jin; Pearl, Judea (2002). "Una condición de identificación general para los efectos causales" . Actas de la Decimoctava Conferencia Nacional de Inteligencia Artificial . ISBN 978-0-262-51129-2.

[3] Shpitser, Ilya; Pearl, Judea (2008). "Métodos completos de identificación de la jerarquía causal" (PDF) . Revista de investigación sobre aprendizaje automático . 9 : 1941-1979.

[4] Huang, Y .; Valtorta, M. (2006). "Identificabilidad en redes causales bayesianas: un algoritmo sólido y completo". Procedimientos de AAAI .

[5] Bareinboim, Elías; Pearl, Judea (2012). "Inferencia causal por experimentos sustitutos: z-identificabilidad". Actas de la vigésimo octava conferencia sobre incertidumbre en inteligencia artificial . arXiv : 1210.4842 . Código bibliográfico : 2012arXiv1210.4842B . ISBN 978-0-9749039-8-9.

[6] Tian, Jin; Pearl, Judea (2002). "Sobre las implicaciones comprobables de modelos causales con variables ocultas". Actas de la Decimoctava Conferencia sobre Incertidumbre en Inteligencia Artificial . págs. 519–27. arXiv : 1301.0608 . Código bibliográfico : 2013arXiv1301.0608T . ISBN 978-1-55860-897-9.

[7] Shpitser, Ilya; Pearl, Judea (2008). "Independencia durmiente". Procedimientos de AAAI .

[8] Chen, Bryant; Pearl, Judea (2014). "Implicaciones comprobables de modelos de ecuaciones estructurales lineales". Procedimientos de AAAI .

[9] Bareinmboim, Elías; Pearl, Judea (2014). "Validez externa: del do-cálculo a la transportabilidad entre poblaciones". Ciencia estadística . 29 (4): 579–595. arXiv : 1503.01603 . doi : 10.1214 / 14-pts486 .

[10] Mohan, Karthika; Pearl, Judea; Tian, Jin (2013). "Modelos gráficos para inferencia con datos faltantes". Avances en sistemas de procesamiento de información neuronal .

[11] Bareinboim, Elías; Tian, Jin; Pearl, Judea (2014). "Recuperación del sesgo de selección en la inferencia causal y estadística". Procedimientos de AAAI .

[12] Wright, S. (1921). "Correlación y causalidad". Revista de Investigación Agrícola . 20 : 557–585.

[13] Blalock, HM (1960). "Análisis correlacional e inferencias causales" . Antropólogo estadounidense . 62 (4): 624–631. doi : 10.1525 / aa.1960.62.4.02a00060 .

[14] Duncan, OD (1966). "Análisis de ruta: ejemplos sociológicos". Revista Estadounidense de Sociología . 72 : 1-16. doi : 10.1086 / 224256 .

[15] Duncan, OD (1976). "Introducción a los modelos de ecuaciones estructurales". Revista Estadounidense de Sociología . 82 (3): 731–733. doi : 10.1086 / 226377 .

[16] Jöreskog, KG (1969). "Un enfoque general para el análisis confirmatorio del factor de máxima verosimilitud". Psychometrika . 34 (2): 183–202. doi : 10.1007 / bf02289343 .

[17] Goldberger, AS; Duncan, OD (1973). Modelos de ecuaciones estructurales en las ciencias sociales . Nueva York: Seminar Press.

[18] Goldberger, AS (1972). "Modelos de ecuaciones estructurales en las ciencias sociales". Econometrica . 40 (6): 979–1001. doi : 10.2307 / 1913851 . JSTOR 1913851 .

[19] White, Halbert; Chalak, Karim; Lu, Xun (2011). "Vinculación de la causalidad de Granger y el modelo causal de la perla con sistemas configurables". Causalidad en los desafíos de las series temporales en el aprendizaje automático . 5 .

[20] Rothman, Kenneth J .; Groenlandia, Sander; Lash, Timothy (2008). Epidemiología moderna . Lippincott Williams y Wilkins.

[21] Morgan, SL; Winship, C. (2007). Contrafactuales e inferencia causal: métodos y principios para la investigación social . Nueva York: Cambridge University Press.

[22] Geiger, Dan; Pearl, Judea (1993). "Propiedades lógicas y algorítmicas de la independencia condicional". Annals of Statistics . 21 (4): 2001-2021. CiteSeerX 10.1.1.295.2043 . doi : 10.1214 / aos / 1176349407 .

[23] Chen, B .; Perla, J (2014). "Herramientas gráficas para el modelado de ecuaciones estructurales lineales". Informe técnico .

[1]