En estadística, un factor de confusión (también variable de confusión , factor de confusión , determinante extraño o variable al acecho ) es una variable que influye tanto en la variable dependiente como en la variable independiente , provocando una asociación espuria . La confusión es un concepto causal y, como tal, no puede describirse en términos de correlaciones o asociaciones. [1] [2] [3]
Definición
La confusión se define en términos del modelo de generación de datos (como en la figura anterior). Sea X una variable independiente e Y una variable dependiente . Para estimar el efecto de X en Y , el estadístico debe suprimir los efectos de variables externas que influyen tanto en X e Y . Decimos que X e Y son confundidos por alguna otra variable Z cuando Z influye causalmente ambos X e Y .
Dejar sea la probabilidad del evento Y = y bajo la intervención hipotética X = x . X e Y no se confunden si y solo si se cumple lo siguiente:
( 1 )
para todos los valores X = x e Y = y , dondees la probabilidad condicional de ver X = x . De manera intuitiva, esta igualdad establece que X e Y no se confunden siempre que la asociación observada observacionalmente entre ellos sea la misma que la asociación que se mediría en un experimento controlado , con x aleatorizado .
En principio, la definición de igualdad se puede verificar a partir del modelo de generación de datos, asumiendo que tenemos todas las ecuaciones y probabilidades asociadas con el modelo. Esto se hace simulando una intervención.(ver red bayesiana ) y comprobar si la probabilidad resultante de Y es igual a la probabilidad condicional. Sin embargo, resulta que la estructura del gráfico por sí sola es suficiente para verificar la igualdad.
Control
Considere a un investigador que intenta evaluar la efectividad del fármaco X , a partir de datos de población en los que el uso del fármaco fue una elección del paciente. Los datos muestran que el género ( Z ) influye en la elección del fármaco por parte del paciente, así como en sus posibilidades de recuperación ( Y ). En este escenario, el género Z confunde la relación entre X e Y ya que Z es una causa tanto de X como de Y :
Tenemos eso
( 2 )
porque la cantidad observacional contiene información sobre la correlación entre X y Z , y la cantidad intervencionista no (ya que X no está correlacionada con Z en un experimento aleatorio). El estadístico desea la estimación insesgada, pero en los casos en los que solo se dispone de datos de observación, una estimación insesgada solo se puede obtener "ajustando" todos los factores de confusión, es decir, condicionando sus diversos valores y promediando el resultado. En el caso de un solo factor de confusión Z , esto conduce a la "fórmula de ajuste":
( 3 )
lo que da una estimación no sesgada para el efecto causal de X en Y . La misma fórmula de ajuste funciona cuando existen múltiples factores de confusión, excepto que, en este caso, la elección de un conjunto Z de variables que garantizaría estimaciones no sesgadas debe hacerse con precaución. El criterio para una elección adecuada de variables se llama la puerta trasera [4] [5] y requiere que el conjunto elegido Z "bloquee" (o intercepte) [ aclaración necesaria ] cada camino [ aclaración necesaria ] de X a Y que termina con una flecha en X. Dichos conjuntos se denominan "admisible por la puerta trasera" y pueden incluir variables que no son causas comunes de X e Y , sino simplemente sustitutos de las mismas.
Volviendo al ejemplo del uso de drogas, dado que Z cumple con el requisito de puerta trasera (es decir, intercepta el camino de una puerta trasera), la fórmula de ajuste de la puerta trasera es válida:
( 4 )
De esta manera, el médico puede predecir el efecto probable de administrar el fármaco a partir de estudios observacionales en los que las probabilidades condicionales que aparecen en el lado derecho de la ecuación pueden estimarse mediante regresión.
Contrariamente a las creencias comunes, agregar covariables al conjunto de ajuste Z puede introducir sesgos. Un contraejemplo típico se produce cuando Z es un efecto común de X y Y , [6] un caso en el que Z no es un factor de confusión (es decir, el conjunto nulo es admisible Back-puerta) y ajustar por Z crearía sesgo conocido como " colisionador sesgo "o" paradoja de Berkson ".
En general, la confusión puede controlarse mediante ajuste si y solo si hay un conjunto de covariables observadas que satisfaga la condición de puerta trasera. Además, si Z es tal conjunto, entonces la fórmula de ajuste de la Ec. (3) es válido <4,5>. El docálculo de Pearl proporciona condiciones adicionales bajo las cuales se puede estimar P ( y | do ( x )), no necesariamente mediante ajuste. [7]
Historia
Según Morabia (2011), [8] la palabra deriva del verbo latino medieval "confudere", que significaba "mezclar", y probablemente fue elegido para representar la confusión (del latín: con = con + fusus = mezclar o fusionar ) entre la causa que se desea evaluar y otras causas que pueden afectar el resultado y, por lo tanto, confundir o interponerse en el camino de la evaluación deseada. Fisher usó la palabra "confusión" en su libro de 1935 "El diseño de experimentos" [9] para denotar cualquier fuente de error en su ideal de experimento aleatorio. Según Vandenbroucke (2004) [10] fue Kish [11] quien usó la palabra "confuso" en el sentido moderno de la palabra, para significar "incomparabilidad" de dos o más grupos (por ejemplo, expuestos y no expuestos) en una observación estudio.
Las condiciones formales que definen lo que hace que ciertos grupos sean "comparables" y otros "incomparables" fueron posteriormente desarrolladas en epidemiología por Greenland y Robins (1986) [12] utilizando el lenguaje contrafactual de Neyman (1935) [13] y Rubin (1974). [14] Estos se complementaron posteriormente con criterios gráficos como la condición de puerta trasera ( Pearl 1993; Greenland, Pearl y Robins, 1999). [3] [4]
Se demostró que los criterios gráficos eran formalmente equivalentes a la definición contrafáctica, [15] pero más transparentes para los investigadores que se basan en modelos de procesos.
Tipos
En el caso de las evaluaciones de riesgo que evalúan la magnitud y la naturaleza del riesgo para la salud humana , es importante controlar los factores de confusión para aislar el efecto de un peligro particular, como un aditivo alimentario, un pesticida o un nuevo fármaco. Para los estudios prospectivos, es difícil reclutar y seleccionar voluntarios con los mismos antecedentes (edad, dieta, educación, geografía, etc.), y en los estudios históricos, puede haber una variabilidad similar. Debido a la incapacidad de controlar la variabilidad de los voluntarios y los estudios en humanos, la confusión es un desafío particular. Por estas razones, los experimentos ofrecen una forma de evitar la mayoría de las formas de confusión.
En algunas disciplinas, la confusión se clasifica en diferentes tipos. En epidemiología , un tipo es "confusión por indicación", [16] que se relaciona con la confusión de estudios observacionales . Debido a que los factores de pronóstico pueden influir en las decisiones de tratamiento (y sesgar las estimaciones de los efectos del tratamiento), controlar los factores de pronóstico conocidos puede reducir este problema, pero siempre es posible que no se haya incluido un factor olvidado o desconocido o que los factores interactúen de manera compleja. La confusión por indicación se ha descrito como la limitación más importante de los estudios observacionales. Los ensayos aleatorios no se ven afectados por la confusión por indicación debida a la asignación aleatoria .
Las variables de confusión también pueden clasificarse según su fuente. La elección del instrumento de medición (confusión operativa), características situacionales (confusión de procedimiento) o diferencias interindividuales (confusión de la persona).
- Puede producirse una confusión operativa en diseños de investigación tanto experimentales como no experimentales. Este tipo de confusión ocurre cuando una medida diseñada para evaluar un constructo en particular también mide inadvertidamente otra cosa. [17]
- Una confusión de procedimiento puede ocurrir en un experimento de laboratorio o un cuasi-experimento . Este tipo de confusión ocurre cuando el investigador permite erróneamente que otra variable cambie junto con la variable independiente manipulada. [17]
- La confusión de una persona ocurre cuando dos o más grupos de unidades se analizan juntos (por ejemplo, trabajadores de diferentes ocupaciones), a pesar de variar según una o más características (observadas o no observadas) (por ejemplo, género). [18]
Ejemplos de
Digamos que uno está estudiando la relación entre el orden de nacimiento (primer hijo, segundo hijo, etc.) y la presencia del síndrome de Down en el niño. En este escenario, la edad materna sería una variable de confusión:
- La edad materna más alta se asocia directamente con el síndrome de Down en el niño
- La edad materna más alta se asocia directamente con el síndrome de Down, independientemente del orden de nacimiento (una madre que tenga su primer hijo frente a su tercer hijo a los 50 años conlleva el mismo riesgo)
- La edad materna está directamente relacionada con el orden de nacimiento (el segundo hijo, excepto en el caso de gemelos, nace cuando la madre es mayor que la que tenía para el nacimiento del primer hijo)
- La edad materna no es consecuencia del orden de nacimiento (tener un segundo hijo no cambia la edad de la madre)
En las evaluaciones de riesgo , factores como la edad, el género y los niveles educativos a menudo afectan el estado de salud y, por lo tanto, deben controlarse. Más allá de estos factores, es posible que los investigadores no consideren o no tengan acceso a datos sobre otros factores causales. Un ejemplo es el estudio del consumo de tabaco en la salud humana. Fumar, beber alcohol y hacer dieta son actividades relacionadas con el estilo de vida. Una evaluación de riesgos que analiza los efectos del tabaquismo pero no controla el consumo de alcohol o la dieta puede sobrestimar el riesgo de fumar. [19] El tabaquismo y los factores de confusión se examinan en las evaluaciones de riesgos laborales, como la seguridad de la minería del carbón. [20] Cuando no hay una gran muestra de población de no fumadores o no bebedores en una ocupación en particular, la evaluación del riesgo puede estar sesgada hacia la búsqueda de un efecto negativo en la salud.
Disminuir el potencial de confusión
Se puede obtener una reducción en el potencial de ocurrencia y efecto de factores de confusión aumentando los tipos y números de comparaciones realizadas en un análisis. Si las medidas o manipulaciones de los constructos centrales se confunden (es decir, existen confusiones operativas o de procedimiento), es posible que el análisis de subgrupos no revele problemas en el análisis. Además, aumentar el número de comparaciones puede crear otros problemas (ver comparaciones múltiples ).
La revisión por pares es un proceso que puede ayudar a reducir los casos de confusión, ya sea antes de la implementación del estudio o después de que se haya realizado el análisis. La revisión por pares se basa en la experiencia colectiva dentro de una disciplina para identificar posibles debilidades en el diseño y análisis del estudio, incluidas las formas en que los resultados pueden depender de la confusión. De manera similar, la replicación puede probar la solidez de los hallazgos de un estudio en condiciones de estudio alternativas o análisis alternativos (por ejemplo, controlando posibles confusiones no identificadas en el estudio inicial).
Es menos probable que ocurran efectos de confusión y que actúen de manera similar en múltiples momentos y lugares. [ cita requerida ] Al seleccionar los sitios de estudio, el medio ambiente se puede caracterizar en detalle en los sitios de estudio para garantizar que los sitios sean ecológicamente similares y, por lo tanto, es menos probable que tengan variables de confusión. Por último, se puede estudiar la relación entre las variables ambientales que posiblemente confunden el análisis y los parámetros medidos. La información relacionada con las variables ambientales se puede utilizar en modelos específicos del sitio para identificar la variación residual que puede deberse a efectos reales. [21]
Dependiendo del tipo de diseño de estudio implementado, hay varias formas de modificar ese diseño para excluir o controlar activamente las variables de confusión: [22]
- Los estudios de casos y controles asignan factores de confusión a ambos grupos, casos y controles, por igual. Por ejemplo, si alguien quisiera estudiar la causa del infarto de miocardio y cree que la edad es una variable de confusión probable, cada paciente con infarto de 67 años se emparejará con una persona "control" sana de 67 años. En los estudios de casos y controles, las variables emparejadas con mayor frecuencia son la edad y el sexo. Inconveniente: Los estudios de casos y controles son factibles solo cuando es fácil encontrar controles, es decir , personas cuyo estado con respecto a todos los posibles factores de confusión conocidos es el mismo que el del paciente del caso: suponga que un estudio de casos y controles intenta encontrar la causa de una enfermedad determinada en una persona que tiene 1) 45 años, 2) afroamericano, 3) de Alaska , 4) un ávido jugador de fútbol, 5) vegetariano y 6) que trabaja en la educación. Un control teóricamente perfecto sería una persona que, además de no tener la enfermedad que se está investigando, reúne todas estas características y no tiene enfermedades que el paciente no tenga también, pero encontrar ese control sería una tarea enorme.
- Estudios de cohortes : también es posible cierto grado de emparejamiento y, a menudo, se realiza admitiendo solo ciertos grupos de edad o un determinado sexo en la población de estudio, creando una cohorte de personas que comparten características similares y, por lo tanto, todas las cohortes son comparables en lo que respecta a los posibles variable de confusión. Por ejemplo, si se cree que la edad y el sexo son factores de confusión, solo los hombres de 40 a 50 años estarían involucrados en un estudio de cohorte que evaluaría el riesgo de infarto de miocardio en las cohortes que son físicamente activas o inactivas. Inconveniente: En los estudios de cohortes, la sobreexclusión de los datos de entrada puede llevar a los investigadores a definir de manera demasiado estrecha el conjunto de personas en situación similar para las que afirman que el estudio es útil, de modo que otras personas a las que de hecho se aplica la relación causal pueden perder la ventaja. oportunidad de beneficiarse de las recomendaciones del estudio. De manera similar, la "estratificación excesiva" de los datos de entrada dentro de un estudio puede reducir el tamaño de la muestra en un estrato dado hasta el punto en que las generalizaciones extraídas mediante la observación de los miembros de ese estrato solo no sean estadísticamente significativas .
- Doble cegamiento : oculta a la población del ensayo y a los observadores la pertenencia al grupo experimental de los participantes. Al evitar que los participantes sepan si están recibiendo tratamiento o no, el efecto placebo debe ser el mismo para los grupos de control y de tratamiento. Al evitar que los observadores conozcan su membresía, no debería haber ningún sesgo por parte de los investigadores que tratan a los grupos de manera diferente o de interpretar los resultados de manera diferente.
- Ensayo controlado aleatorio : método en el que la población del estudio se divide al azar para mitigar las posibilidades de autoselección por parte de los participantes o sesgo por parte de los diseñadores del estudio. Antes de que comience el experimento, los probadores asignarán a los miembros del grupo de participantes a sus grupos (control, intervención, paralelo), utilizando un proceso de aleatorización como el uso de un generador de números aleatorios. Por ejemplo, en un estudio sobre los efectos del ejercicio, las conclusiones serían menos válidas si a los participantes se les diera la opción de pertenecer al grupo de control que no haría ejercicio o al grupo de intervención que estaría dispuesto a participar en un evento. programa de ejercicio. Luego, el estudio capturaría otras variables además del ejercicio, como los niveles de salud previos al experimento y la motivación para adoptar actividades saludables. Desde el lado del observador, el experimentador puede elegir candidatos que tienen más probabilidades de mostrar los resultados que el estudio quiere ver o pueden interpretar los resultados subjetivos (actitud más enérgica y positiva) de una manera favorable a sus deseos.
- Estratificación : como en el ejemplo anterior, se cree que la actividad física es un comportamiento que protege del infarto de miocardio; y se supone que la edad es un posible factor de confusión. Los datos muestreados se estratifican luego por grupo de edad; esto significa que la asociación entre actividad e infarto se analizaría por cada grupo de edad. Si los diferentes grupos de edad (o estratos de edad) arrojan cocientes de riesgo muy diferentes , la edad debe verse como una variable de confusión. Existen herramientas estadísticas, entre ellas los métodos de Mantel-Haenszel, que dan cuenta de la estratificación de conjuntos de datos.
- Controlar los factores de confusión midiendo los factores de confusión conocidos e incluyéndolos como covariables es un análisis multivariable como el análisis de regresión . Los análisis multivariados revelan mucha menos información sobre la fuerza o polaridad de la variable de confusión que los métodos de estratificación. Por ejemplo, si el análisis multivariado controla los antidepresivos y no estratifica los antidepresivos para TCA e ISRS , entonces ignorará que estas dos clases de antidepresivos tienen efectos opuestos sobre el infarto de miocardio, y uno es mucho más fuerte que el otro.
Todos estos métodos tienen sus inconvenientes:
- La mejor defensa disponible contra la posibilidad de resultados falsos debido a la confusión es a menudo prescindir de los esfuerzos de estratificación y, en cambio, realizar un estudio aleatorio de una muestra suficientemente grande tomada como un todo, de modo que todas las posibles variables de confusión (conocidas y desconocidas) serán distribuidos al azar en todos los grupos de estudio y, por lo tanto, no estarán correlacionados con la variable binaria para la inclusión / exclusión en cualquier grupo.
- Consideraciones éticas: en los ensayos controlados aleatorios y doble ciego, los participantes no saben que son receptores de tratamientos simulados y es posible que se les nieguen tratamientos efectivos. [23] Existe la posibilidad de que los pacientes solo acepten la cirugía invasiva (que conlleva riesgos médicos reales) bajo el entendimiento de que están recibiendo tratamiento. Aunque se trata de una preocupación ética, no es una descripción completa de la situación. Para las cirugías que actualmente se realizan con regularidad, pero para las que no hay evidencia concreta de un efecto genuino, puede haber problemas éticos para continuar con dichas cirugías. En tales circunstancias, muchas personas están expuestas a los riesgos reales de la cirugía, pero estos tratamientos posiblemente no ofrezcan ningún beneficio discernible. El control de la cirugía simulada es un método que puede permitir a la ciencia médica determinar si un procedimiento quirúrgico es eficaz o no. Dado que existen riesgos conocidos asociados con las operaciones médicas, es cuestionablemente ético permitir que se realicen cirugías no verificadas ad infinitum en el futuro.
Ver también
- Evidencia anecdótica : evidencia basada en testimonio personal
- Inferencia causal : rama de la estadística que se ocupa de inferir relaciones causales entre variables.
- Método epidemiológico - Método científico en el campo específico
- Paradoja de Simpson : fenómeno de probabilidad y estadística en el que aparece una tendencia en grupos de datos pero desaparece cuando se combinan estos grupos.
Referencias
- ^ Perla, J., (2009). Paradoja de Simpson , confusión y colapso en la causalidad: modelos, razonamiento e inferencia (2ª ed.). Nueva York: Cambridge University Press.
- ^ VanderWeele, TJ; Shpitser, I. (2013). "Sobre la definición de un factor de confusión" . Annals of Statistics . 41 (1): 196–220. arXiv : 1304.0564 . doi : 10.1214 / 12-aos1058 . PMC 4276366 . PMID 25544784 .
- ^ a b Groenlandia, S .; Robins, JM; Pearl, J. (1999). "Confusión y colapsabilidad en la inferencia causal" . Ciencia estadística . 14 (1): 29–46. doi : 10.1214 / ss / 1009211805 .
- ↑ a b Pearl, J., (1993). "Aspectos de los modelos gráficos relacionados con la causalidad", en las actas de la 49ª sesión del Instituto Internacional de Ciencias de la Estadística, págs. 391–401.
- ^ Perla, J. (2009). Diagramas causales e identificación de efectos causales en la causalidad: modelos, razonamiento e inferencia (2ª ed.). Nueva York, NY, EE.UU .: Cambridge University Press.
- ^ Lee, PH (2014). "¿Debemos ajustarnos por un factor de confusión si los criterios empíricos y teóricos arrojan resultados contradictorios? Un estudio de simulación" . Sci Rep . 4 : 6085. Código Bibliográfico : 2014NatSR ... 4E6085L . doi : 10.1038 / srep06085 . PMC 5381407 . PMID 25124526 .
- ^ Shpitser, I .; Pearl, J. (2008). "Métodos completos de identificación de la jerarquía causal". The Journal of Machine Learning Research . 9 : 1941-1979.
- ^ Morabia, A (2011). "Historia del concepto epidemiológico moderno de confusión" (PDF) . Revista de epidemiología y salud comunitaria . 65 (4): 297–300. doi : 10.1136 / jech.2010.112565 . PMID 20696848 . S2CID 9068532 .
- ^ Fisher, RA (1935). El diseño de experimentos (págs. 114-145).
- ^ Vandenbroucke, JP (2004). "La historia de la confusión". Soz Praventivmed . 47 (4): 216–224. doi : 10.1007 / BF01326402 . PMID 12415925 . S2CID 198174446 .
- ^ Kish, L (1959). "Algunos problemas estadísticos en el diseño de la investigación". Am Sociol . 26 (3): 328–338. doi : 10.2307 / 2089381 . JSTOR 2089381 .
- ^ Groenlandia, S .; Robins, JM (1986). "Identificabilidad, intercambiabilidad y confusión epidemiológica". Revista Internacional de Epidemiología . 15 (3): 413–419. CiteSeerX 10.1.1.157.6445 . doi : 10.1093 / ije / 15.3.413 . PMID 3771081 .
- ^ Neyman, J., con la cooperación de K. Iwaskiewics y St. Kolodziejczyk (1935). Problemas estadísticos en la experimentación agrícola (con discusión). Suppl J Roy Statist Soc Ser B 2 107-180.
- ^ Rubin, DB (1974). "Estimación de los efectos causales de los tratamientos en estudios aleatorizados y no aleatorizados". Revista de Psicología de la Educación . 66 (5): 688–701. doi : 10.1037 / h0037350 . S2CID 52832751 .
- ^ Perla, J., (2009). Causalidad: modelos, razonamiento e inferencia (2ª ed.). Nueva York, NY, EE.UU .: Cambridge University Press.
- ^ Johnston, SC (2001). "Identificación de confusión por indicación a través de una revisión prospectiva cegada" . Soy J Epidemiol . 154 (3): 276–284. doi : 10.1093 / aje / 154.3.276 . PMID 11479193 .
- ^ a b Pelham, Brett (2006). Realización de investigaciones en psicología . Belmont: Wadsworth. ISBN 978-0-534-53294-9.
- ^ Steg, L .; Buunk, AP; Rothengatter, T. (2008). "Capítulo 4". Psicología Social Aplicada: Comprensión y manejo de problemas sociales . Cambridge, Reino Unido: Cambridge University Press.
- ^ Tjønneland, Anne; Grønbæk, Morten; Stripp, Connie; Overvad, Kim (enero de 1999). "Ingesta de vino y dieta en una muestra aleatoria de 48763 hombres y mujeres daneses" . Sociedad Estadounidense de Nutrición Revista Estadounidense de Nutrición Clínica . 69 (1): 49–54. doi : 10.1093 / ajcn / 69.1.49 . PMID 9925122 .
- ^ Axelson, O. (1989). "Confusión por fumar en epidemiología ocupacional" . Revista británica de medicina industrial . 46 (8): 505–07. doi : 10.1136 / oem.46.8.505 . PMC 1009818 . PMID 2673334 .
- ^ Calow, Peter P. (2009) Manual de gestión y evaluación de riesgos ambientales , Wiley
- ^ Mayrent, Jerez L (1987). Epidemiología en Medicina . Lippincott Williams y Wilkins . ISBN 978-0-316-35636-7.
- ^ Emanuel, Ezekiel J; Miller, Franklin G (20 de septiembre de 2001). "La ética de los ensayos controlados con placebo: un término medio". Revista de Medicina de Nueva Inglaterra . 345 (12): 915–9. doi : 10.1056 / nejm200109203451211 . PMID 11565527 .
Otras lecturas
- Pearl, J. (enero de 1998). "Por qué no hay una prueba estadística para los factores de confusión, por qué muchos piensan que los hay y por qué casi tienen razón" (PDF) . Departamento de Ciencias de la Computación de UCLA, Informe técnico R-256 .
- Montgomery, DC (2001). "Bloqueo y confusión en elDiseño factorial ". Diseño y análisis de experimentos (5ª ed.). Wiley. Págs. 287-302. Este libro de texto tiene una descripción general de los factores de confusión y cómo explicarlos en el diseño de experimentos.CS1 maint: posdata ( enlace )
enlaces externos
Estos sitios contienen descripciones o ejemplos de variables de confusión:
- Tutorial: Modificación de medidas de confusión y efectos (Escuela de Salud Pública de la Universidad de Boston)
- Regresión lineal (Universidad de Yale)
- Tutorial de la Universidad de Nueva Inglaterra