En estadística , el análisis de ruta se utiliza para describir las dependencias dirigidas entre un conjunto de variables. Esto incluye los modelos equivalentes a cualquier forma de análisis de regresión múltiple , análisis de factores , análisis de correlación canónica , análisis discriminante , así como las familias más generales de modelos en el análisis multivariante de la varianza y covarianza análisis ( MANOVA , ANOVA , ANCOVA ).
Además de pensarse como una forma de regresión múltiple que se centra en la causalidad, el análisis de ruta puede verse como un caso especial de modelado de ecuaciones estructurales (SEM) , en el que solo se emplean indicadores únicos para cada una de las variables del modelo causal. . Es decir, el análisis de ruta es SEM con un modelo estructural, pero sin modelo de medición. Otros términos utilizados para referirse al análisis de ruta incluyen modelos causales, análisis de estructuras de covarianza y modelos de variables latentes .
Judea Pearl considera que el análisis de caminos es un antepasado directo de las técnicas de inferencia causal . [1]
Historia
El análisis de rutas fue desarrollado alrededor de 1918 por el genetista Sewall Wright , quien escribió sobre él de manera más extensa en la década de 1920. [2] Desde entonces, se ha aplicado a una amplia gama de áreas complejas de modelado, que incluyen biología , psicología , sociología y econometría . [3]
Modelado de ruta
Por lo general, los modelos de ruta consisten en variables independientes y dependientes representadas gráficamente por cuadros o rectángulos. Las variables que son independientes y no dependientes se denominan "exógenas". Gráficamente, estos cuadros de variables exógenas se encuentran en los bordes exteriores del modelo y solo tienen flechas de una sola cabeza que salen de ellos. Ninguna flecha de una sola cabeza apunta a variables exógenas. Las variables que son únicamente variables dependientes, o tanto independientes como dependientes, se denominan "endógenas". Gráficamente, las variables endógenas tienen al menos una flecha de una sola punta apuntando hacia ellas.
En el modelo siguiente, las dos variables exógenas (Ex 1 y Ex 2 ) se modelan como si estuvieran correlacionadas como se muestra con la flecha de dos puntas. Ambas variables tienen efectos directos e indirectos (a través de En 1 ) sobre En 2 (las dos variables / factores dependientes o 'endógenos'). En la mayoría de los modelos del mundo real, las variables endógenas también pueden verse afectadas por variables y factores externos al modelo (efectos externos, incluido el error de medición). Estos efectos se representan mediante la "e" o términos de error en el modelo.
Utilizando las mismas variables, se pueden concebir modelos alternativos. Por ejemplo, se puede plantear la hipótesis de que Ex 1 tiene solo un efecto indirecto sobre En 2 , eliminando la flecha de Ex 1 a En 2 ; y la probabilidad o el "ajuste" de estos dos modelos se puede comparar estadísticamente.
Reglas de rastreo de ruta
Con el fin de calcular válidamente la relación entre dos casillas cualesquiera en el diagrama, Wright (1934) propuso un conjunto simple de reglas de trazado de ruta [4] para calcular la correlación entre dos variables. La correlación es igual a la suma de la contribución de todas las vías a través de las cuales se conectan las dos variables. La fuerza de cada una de estas rutas contribuyentes se calcula como el producto de los coeficientes de ruta a lo largo de esa ruta.
Las reglas para el rastreo de rutas son:
- Puede rastrear una flecha hacia atrás y luego hacia adelante a lo largo de la siguiente, o hacia adelante de una variable a la otra, pero nunca hacia adelante y luego hacia atrás. Otra forma de pensar en esta regla es que nunca se puede pasar de una punta de flecha a otra punta de flecha: cara-cruz o cruz-cabeza, no cara-cara.
- Puede pasar por cada variable solo una vez en una determinada cadena de caminos.
- No se puede incluir más de una flecha bidireccional en cada cadena de ruta.
Nuevamente, la correlación esperada debido a cada cadena trazada entre dos variables es el producto de los coeficientes de ruta estandarizados, y la correlación esperada total entre dos variables es la suma de estas cadenas de ruta contribuyentes.
NB : Las reglas de Wright asumen un modelo sin ciclos de retroalimentación: el gráfico dirigido del modelo no debe contener ciclos , es decir, es un gráfico acíclico dirigido , que ha sido ampliamente estudiado en el marco de análisis causal de Judea Pearl .
Trazado de ruta en modelos no estandarizados
Si las variables modeladas no se han estandarizado, una regla adicional permite calcular las covarianzas esperadas siempre que no existan caminos que conecten las variables dependientes con otras variables dependientes.
El caso más simple se obtiene cuando todas las varianzas residuales se modelan explícitamente. En este caso, además de las tres reglas anteriores, calcule las covarianzas esperadas mediante:
- Calcule el producto de los coeficientes en cada ruta entre las variables de interés, rastreando hacia atrás, cambiando de dirección en una flecha de dos puntas, luego rastreando hacia adelante.
- Suma de todas las rutas distintas, donde las rutas se consideran distintas si contienen coeficientes diferentes, o encuentran esos coeficientes en un orden diferente.
Cuando las varianzas residuales no se incluyen explícitamente, o como una solución más general, en cualquier cambio de dirección encontrado en una ruta (excepto en las flechas de dos direcciones), incluya la varianza de la variable en el punto de cambio. Es decir, al trazar una ruta desde una variable dependiente a una variable independiente, incluya la varianza de la variable independiente, excepto cuando hacerlo violaría la regla 1 anterior (pasando a través de puntas de flecha adyacentes: es decir, cuando la variable independiente también se conecta a un doble -flecha con punta que la conecta a otra variable independiente). Al derivar las varianzas (lo cual es necesario en el caso de que no se modelen explícitamente), la ruta de una variable dependiente a una variable independiente y viceversa se cuenta una sola vez.
Ver también
Referencias
- ^ Pearl, Judea (mayo de 2018). El libro del por qué . Nueva York: Basic Books. pag. 6. ISBN 978-0-465-09760-9.
- ^ Wright, S. (1921). "Correlación y causalidad". J. Investigación agrícola . 20 : 557–585.
- ^ Dodge, Y. (2003) El diccionario de términos estadísticos de Oxford. OUP. ISBN 0-19-920613-9
- ^ Wright, S. (1934). "El método de los coeficientes de trayectoria" . Anales de estadística matemática . 5 (3): 161–215. doi : 10.1214 / aoms / 1177732676 .