Modelo causal de Rubin


El modelo causal de Rubin ( RCM ), también conocido como el modelo causal de Neyman-Rubin , [1] es un enfoque para el análisis estadístico de causa y efecto basado en el marco de resultados potenciales , llamado así por Donald Rubin . El nombre "modelo causal de Rubin" fue acuñado por primera vez por Paul W. Holland . [2] El marco de resultados potenciales fue propuesto por primera vez por Jerzy Neyman en su tesis de maestría de 1923, [3] aunque lo discutió solo en el contexto de experimentos completamente aleatorios. [4] Rubin lo extendió a un marco general para pensar sobre la causalidad tanto en estudios observacionales como experimentales. [1]

El modelo causal de Rubin se basa en la idea de resultados potenciales. Por ejemplo, una persona tendría un ingreso particular a los 40 años si hubiera asistido a la universidad, mientras que tendría un ingreso diferente a los 40 años si no hubiera asistido a la universidad. Para medir el efecto causal de ir a la universidad para esta persona, necesitamos comparar el resultado para el mismo individuo en ambos futuros alternativos. Dado que es imposible ver ambos resultados potenciales a la vez, siempre falta uno de los resultados potenciales. Este dilema es el "problema fundamental de la inferencia causal ".

Debido al problema fundamental de la inferencia causal, los efectos causales a nivel de unidad no pueden observarse directamente. Sin embargo, los experimentos aleatorios permiten la estimación de los efectos causales a nivel de población. [5] Un experimento aleatorio asigna personas aleatoriamente a los tratamientos: universidad o no universidad. Debido a esta asignación aleatoria, los grupos son (en promedio) equivalentes, y la diferencia de ingresos a los 40 años se puede atribuir a la asignación a la universidad, ya que esa fue la única diferencia entre los grupos. Luego, se puede obtener una estimación del efecto causal promedio (también denominado efecto de tratamiento promedio ) calculando la diferencia de medias entre las muestras tratadas (que asisten a la universidad) y las muestras de control (que no asisten a la universidad).

En muchas circunstancias, sin embargo, los experimentos aleatorios no son posibles debido a preocupaciones éticas o prácticas. En tales escenarios, existe un mecanismo de asignación no aleatorio. Este es el caso del ejemplo de la asistencia a la universidad: las personas no son asignadas al azar para asistir a la universidad. Más bien, las personas pueden optar por asistir a la universidad en función de su situación financiera, la educación de los padres, etc. Se han desarrollado muchos métodos estadísticos para la inferencia causal, como la coincidencia de puntuación de propensión . Estos métodos intentan corregir el mecanismo de asignación encontrando unidades de control similares a las unidades de tratamiento.

Intuitivamente, el efecto causal de un tratamiento, E, sobre otro, C, para una unidad en particular y un intervalo de tiempo desde hasta es la diferencia entre lo que hubiera sucedido en el tiempo si la unidad hubiera estado expuesta a E iniciado en y lo que hubiera sucedido en ese momento. si la unidad hubiera estado expuesta a C iniciado en : 'Si hace una hora hubiera tomado dos aspirinas en lugar de solo un vaso de agua, mi dolor de cabeza ahora se habría ido' o 'porque hace una hora tomé dos aspirinas en lugar de solo un vaso de agua, ahora se me ha ido el dolor de cabeza.' Nuestra definición del efecto causal del tratamiento E versus C reflejará este significado intuitivo". [5]