En estadística, econometría, epidemiología, genética y disciplinas relacionadas, los gráficos causales (también conocidos como diagramas de ruta , redes bayesianas causales o DAG) son modelos gráficos probabilísticos que se utilizan para codificar supuestos sobre el proceso de generación de datos.
Los gráficos causales se pueden utilizar para la comunicación y para la inferencia. Como dispositivos de comunicación, los gráficos proporcionan una representación formal y transparente de los supuestos causales que los investigadores pueden desear transmitir y defender. Como herramientas de inferencia, los gráficos permiten a los investigadores estimar los tamaños del efecto a partir de datos no experimentales, [1] [2] [3] [4] [5] derivar implicaciones comprobables de los supuestos codificados, [1] [6] [7] [8] probar la validez externa, [9] y gestionar los datos faltantes [10] y el sesgo de selección. [11]
Los gráficos causales fueron utilizados por primera vez por el genetista Sewall Wright [12] bajo la rúbrica "diagramas de ruta". Posteriormente fueron adoptados por científicos sociales [13] [14] [15] [16] [17] [18] y, en menor medida, por economistas. [19] Estos modelos se limitaron inicialmente a ecuaciones lineales con parámetros fijos. Los desarrollos modernos han extendido los modelos gráficos al análisis no paramétrico, logrando así una generalidad y flexibilidad que ha transformado el análisis causal en la informática, la epidemiología [20] y las ciencias sociales. [21]
Construcción y terminología
El gráfico causal se puede dibujar de la siguiente manera. Cada variable en el modelo tiene un vértice o nodo correspondiente y se dibuja una flecha desde una variable X a una variable Y siempre que se juzga que Y responde a cambios en X cuando todas las demás variables se mantienen constantes. Las variables conectadas a Y mediante flechas directas se denominan padres de Y , o "causas directas de Y ", y se indican mediante Pa (Y) .
Los modelos causales a menudo incluyen "términos de error" o "factores omitidos" que representan todos los factores no medidos que influyen en una variable Y cuando Pa (Y) se mantienen constantes. En la mayoría de los casos, los términos de error se excluyen del gráfico. Sin embargo, si el autor del gráfico sospecha que los términos de error de dos variables cualesquiera son dependientes (por ejemplo, las dos variables tienen una causa común latente o no observada), se dibuja un arco bidireccional entre ellas. Así, la presencia de variables latentes se tiene en cuenta a través de las correlaciones que inducen entre los términos de error, representados por arcos bidireccionales.
Herramientas fundamentales
Una herramienta fundamental en el análisis gráfico es la separación d , que permite a los investigadores determinar, mediante inspección, si la estructura causal implica que dos conjuntos de variables son independientes dado un tercer conjunto. En modelos recursivos sin términos de error correlacionados (a veces llamados Markoviano ), estas independientes condicionales representan todas las implicaciones comprobables del modelo. [22]
Ejemplo
Suponga que deseamos estimar el efecto de asistir a una universidad de élite sobre los ingresos futuros. La simple regresión de los ingresos en la calificación de la universidad no dará una estimación imparcial del efecto objetivo porque las universidades de élite son muy selectivas y es probable que los estudiantes que asisten a ellas tengan calificaciones para trabajos de altos ingresos antes de asistir a la escuela. Suponiendo que las relaciones causales son lineales, este conocimiento previo se puede expresar en la siguiente especificación del modelo de ecuación estructural (SEM).
Modelo 1
dónde representa las calificaciones de la persona antes de la universidad, representa calificaciones después de la universidad, contiene atributos que representan la calidad de la universidad a la que asistió, y el salario del individuo.
La Figura 1 es un gráfico causal que representa la especificación de este modelo. Cada variable del modelo tiene un nodo o vértice correspondiente en el gráfico. Además, para cada ecuación, se dibujan flechas de las variables independientes a las variables dependientes. Estas flechas reflejan la dirección de la causalidad. En algunos casos, podemos etiquetar la flecha con su coeficiente estructural correspondiente como en la Figura 1.
Si y son variables latentes o no observadas, su influencia en y puede atribuirse a sus términos de error. Al eliminarlos, obtenemos la siguiente especificación de modelo:
Modelo 2
La información de fondo especificada por el Modelo 1 implica que el término de error de , , está correlacionado con el término de error de C ,. Como resultado, agregamos un arco bidireccional entre S y C , como en la Figura 2.
Desde está correlacionado con y por lo tanto, , es endógeno y no se identifica en el Modelo 2. Sin embargo, si incluimos la solidez de la solicitud universitaria de una persona, , como se muestra en la Figura 3, obtenemos el siguiente modelo:
Modelo 3
Al eliminar las variables latentes de la especificación del modelo obtenemos:
Modelo 4
con correlacionado con .
Ahora, se identifica y se puede estimar mediante la regresión de en y . Esto se puede verificar utilizando el criterio de puerta única , [1] [23] condición gráfica necesaria y suficiente para la identificación de coeficientes estructurales, como, usando regresión.
Referencias
- ↑ a b c Pearl, Judea (2000). Causalidad . Cambridge, MA: MIT Press.
- ^ Tian, Jin; Pearl, Judea (2002). "Una condición de identificación general para los efectos causales" . Actas de la Decimoctava Conferencia Nacional de Inteligencia Artificial . ISBN 978-0-262-51129-2.
- ^ Shpitser, Ilya; Pearl, Judea (2008). "Métodos completos de identificación de la jerarquía causal" (PDF) . Revista de investigación sobre aprendizaje automático . 9 : 1941-1979.
- ^ Huang, Y .; Valtorta, M. (2006). "Identificabilidad en redes causales bayesianas: un algoritmo sólido y completo". Procedimientos de AAAI .
- ^ Bareinboim, Elías; Pearl, Judea (2012). "Inferencia causal por experimentos sustitutos: z-identificabilidad". Actas de la vigésimo octava conferencia sobre incertidumbre en inteligencia artificial . arXiv : 1210.4842 . Código bibliográfico : 2012arXiv1210.4842B . ISBN 978-0-9749039-8-9.
- ^ Tian, Jin; Pearl, Judea (2002). "Sobre las implicaciones comprobables de modelos causales con variables ocultas". Actas de la Decimoctava Conferencia sobre Incertidumbre en Inteligencia Artificial . págs. 519–27. arXiv : 1301.0608 . Código bibliográfico : 2013arXiv1301.0608T . ISBN 978-1-55860-897-9.
- ^ Shpitser, Ilya; Pearl, Judea (2008). "Independencia durmiente". Procedimientos de AAAI .
- ^ Chen, Bryant; Pearl, Judea (2014). "Implicaciones comprobables de modelos de ecuaciones estructurales lineales". Procedimientos de AAAI .
- ^ Bareinmboim, Elías; Pearl, Judea (2014). "Validez externa: del do-cálculo a la transportabilidad entre poblaciones". Ciencia estadística . 29 (4): 579–595. arXiv : 1503.01603 . doi : 10.1214 / 14-pts486 .
- ^ Mohan, Karthika; Pearl, Judea; Tian, Jin (2013). "Modelos gráficos para inferencia con datos faltantes". Avances en sistemas de procesamiento de información neuronal .
- ^ Bareinboim, Elías; Tian, Jin; Pearl, Judea (2014). "Recuperación del sesgo de selección en la inferencia causal y estadística". Procedimientos de AAAI .
- ^ Wright, S. (1921). "Correlación y causalidad". Revista de Investigación Agrícola . 20 : 557–585.
- ^ Blalock, HM (1960). "Análisis correlacional e inferencias causales" . Antropólogo estadounidense . 62 (4): 624–631. doi : 10.1525 / aa.1960.62.4.02a00060 .
- ^ Duncan, OD (1966). "Análisis de ruta: ejemplos sociológicos". Revista Estadounidense de Sociología . 72 : 1-16. doi : 10.1086 / 224256 .
- ^ Duncan, OD (1976). "Introducción a los modelos de ecuaciones estructurales". Revista Estadounidense de Sociología . 82 (3): 731–733. doi : 10.1086 / 226377 .
- ^ Jöreskog, KG (1969). "Un enfoque general para el análisis confirmatorio del factor de máxima verosimilitud". Psychometrika . 34 (2): 183–202. doi : 10.1007 / bf02289343 .
- ^ Goldberger, AS; Duncan, OD (1973). Modelos de ecuaciones estructurales en las ciencias sociales . Nueva York: Seminar Press.
- ^ Goldberger, AS (1972). "Modelos de ecuaciones estructurales en las ciencias sociales". Econometrica . 40 (6): 979–1001. doi : 10.2307 / 1913851 . JSTOR 1913851 .
- ^ White, Halbert; Chalak, Karim; Lu, Xun (2011). "Vinculación de la causalidad de Granger y el modelo causal de la perla con sistemas configurables". Causalidad en los desafíos de las series temporales en el aprendizaje automático . 5 .
- ^ Rothman, Kenneth J .; Groenlandia, Sander; Lash, Timothy (2008). Epidemiología moderna . Lippincott Williams y Wilkins.
- ^ Morgan, SL; Winship, C. (2007). Contrafactuales e inferencia causal: métodos y principios para la investigación social . Nueva York: Cambridge University Press.
- ^ Geiger, Dan; Pearl, Judea (1993). "Propiedades lógicas y algorítmicas de la independencia condicional". Annals of Statistics . 21 (4): 2001-2021. CiteSeerX 10.1.1.295.2043 . doi : 10.1214 / aos / 1176349407 .
- ^ Chen, B .; Perla, J (2014). "Herramientas gráficas para el modelado de ecuaciones estructurales lineales". Informe técnico .