De Wikipedia, la enciclopedia libre
Saltar a navegación Saltar a búsqueda

El sesgo de selección es el sesgo que introduce la selección de individuos, grupos o datos para el análisis de tal forma que no se logra una adecuada aleatorización, asegurando así que la muestra obtenida no sea representativa de la población que se pretende analizar. [1] A veces se lo denomina efecto de selección . La frase "sesgo de selección" se refiere con mayor frecuencia a la distorsión de un análisis estadístico , resultante del método de recolección de muestras. Si no se tiene en cuenta el sesgo de selección, algunas conclusiones del estudio pueden ser falsas.

Tipos [ editar ]

Sesgo de muestreo [ editar ]

El sesgo de muestreo es un error sistemático debido a una muestra no aleatoria de una población, [2] que hace que algunos miembros de la población tengan menos probabilidades de ser incluidos que otros, lo que da como resultado una muestra sesgada , definida como una muestra estadística de una población ( o factores no humanos) en los que todos los participantes no están igualmente equilibrados u objetivamente representados. [3] Se clasifica principalmente como un subtipo de sesgo de selección, [4] a veces se denomina específicamente sesgo de selección de la muestra , [5] [6] [7] pero algunos lo clasifican como un tipo de sesgo separado. [8]

Una distinción de sesgo de muestreo (aunque no universalmente aceptado) es que socava la validez externa de una prueba (la capacidad de sus resultados para generalizarse al resto de la población), mientras que el sesgo de selección se ocupa principalmente de la validez interna para diferencias o similitudes encontradas en la muestra en cuestión. En este sentido, los errores que ocurren en el proceso de recolección de la muestra o cohorte causan un sesgo de muestreo, mientras que los errores en cualquier proceso posterior causan un sesgo de selección.

Ejemplos de sesgo de muestreo incluyen la autoselección , preselección de los participantes del ensayo, descontando los sujetos del ensayo / pruebas de que no se ejecutan hasta su finalización y el sesgo de la migración mediante la exclusión de los sujetos que han mudado recientemente dentro o fuera de la zona de estudio, el sesgo de longitud , donde se detecta una enfermedad de desarrollo lento con mejor pronóstico, y sesgo de tiempo de espera , donde la enfermedad se diagnostica a los participantes antes que en las poblaciones de comparación, aunque el curso promedio de la enfermedad es el mismo.

Intervalo de tiempo [ editar ]

  • Terminación anticipada de un ensayo en un momento en que sus resultados apoyan la conclusión deseada.
  • Un ensayo puede terminarse anticipadamente con un valor extremo (a menudo por razones éticas ), pero es probable que el valor extremo lo alcance la variable con la varianza más grande , incluso si todas las variables tienen una media similar .

Exposición [ editar ]

  • Sesgo de susceptibilidad
    • Sesgo de susceptibilidad clínica , cuando una enfermedad predispone a una segunda enfermedad, y el tratamiento de la primera enfermedad erróneamente parece predisponer a la segunda enfermedad. Por ejemplo, el síndrome posmenopáusico brinda una mayor probabilidad de desarrollar también cáncer de endometrio , por lo que los estrógenos administrados para el síndrome posmenopáusico pueden recibir una culpa mayor que la real de causar cáncer de endometrio. [9]
    • Sesgo protopático , cuando un tratamiento para los primeros síntomas de una enfermedad u otro resultado parece causar el resultado. Es un sesgo potencial cuando hay un lapso de tiempo entre los primeros síntomas y el inicio del tratamiento antes del diagnóstico real. [9] Se puede mitigar con un retraso , es decir, la exclusión de exposiciones que ocurrieron en un cierto período de tiempo antes del diagnóstico. [10]
    • Sesgo de indicación , una posible confusión entre causa y efecto cuando la exposición depende de la indicación, por ejemplo, se administra un tratamiento a personas con alto riesgo de contraer una enfermedad, lo que puede causar una preponderancia de personas tratadas entre las que contraen la enfermedad. Esto puede provocar una apariencia errónea del tratamiento como causa de la enfermedad. [11]

Datos [ editar ]

  • Particionar (dividir) datos con conocimiento del contenido de las particiones y luego analizarlos con pruebas diseñadas para particiones elegidas a ciegas.
  • Alteración post hoc de la inclusión de datos basada en razones arbitrarias o subjetivas, que incluyen:
    • El cherry picking , que en realidad no es el sesgo de selección, pero el sesgo de confirmación , cuando subconjuntos específicos de datos se eligen para apoyar una conclusión (por ejemplo, citando ejemplos de avión se estrella como una prueba de vuelo de la aerolínea no seguro, sin tener en cuenta el ejemplo más común de los vuelos que completar de forma segura. Consulte: heurística de disponibilidad )
    • Rechazo de datos erróneos por (1) motivos arbitrarios, en lugar de de acuerdo con criterios previamente establecidos o generalmente acordados o (2) descartando " valores atípicos " por motivos estadísticos que no toman en cuenta información importante que podría derivarse de observaciones "salvajes". [12]

Estudios [ editar ]

  • Selección de qué estudios incluir en un metanálisis (ver también metanálisis combinatorio ).
  • Realizar experimentos repetidos y reportar solo los resultados más favorables, quizás reetiquetando los registros de laboratorio de otros experimentos como "pruebas de calibración", "errores de instrumentación" o "estudios preliminares".
  • Presentar el resultado más significativo de una draga de datos como si fuera un solo experimento (que es lógicamente el mismo que el artículo anterior, pero se considera mucho menos deshonesto).

Desgaste [ editar ]

El sesgo de deserción es un tipo de sesgo de selección causado por la deserción (pérdida de participantes), [13] descontando los sujetos de prueba / pruebas que no se completaron. Está estrechamente relacionado con el sesgo de supervivencia , donde solo se incluyen en el análisis los sujetos que "sobrevivieron" a un proceso o el sesgo de falla , donde solo se incluyen los sujetos que "fallaron" en un proceso. Incluye abandono , falta de respuesta ( tasa de respuesta más baja ), abstinencia y desviaciones del protocolo.. Da resultados sesgados cuando es desigual en cuanto a exposición y / o resultado. Por ejemplo, en una prueba de un programa de dieta, el investigador puede simplemente rechazar a todos los que abandonan la prueba, pero la mayoría de los que abandonan son aquellos para quienes no funcionó. Diferentes pérdidas de sujetos en el grupo de intervención y de comparación pueden cambiar las características de estos grupos y los resultados independientemente de la intervención estudiada . [13]

Perdido durante el seguimiento , es otra forma de sesgo de deserción, que ocurre principalmente en estudios médicos durante un período de tiempo prolongado. El sesgo de no respuesta o retención puede verse influenciado por una serie de factores tangibles e intangibles, como; riqueza, educación, altruismo, comprensión inicial del estudio y sus requisitos. [14] Los investigadores también pueden ser incapaces de realizar un contacto de seguimiento como resultado de información de identificación inadecuada y datos de contacto recopilados durante la fase inicial de reclutamiento e investigación. [15]

Selección de observadores [ editar ]

El filósofo Nick Bostrom ha argumentado que los datos se filtran no solo por el diseño y la medición del estudio, sino por la condición previa necesaria de que tiene que haber alguien haciendo un estudio. En situaciones en las que la existencia del observador o del estudio se correlaciona con los datos, se producen efectos de selección de la observación y se requiere un razonamiento antrópico . [dieciséis]

Un ejemplo es el registro de eventos de impacto pasado de la Tierra: si los grandes impactos causan extinciones masivas y alteraciones ecológicas que impiden la evolución de los observadores inteligentes durante largos períodos, nadie observará ninguna evidencia de grandes impactos en el pasado reciente (ya que habrían impedido la evolución de los observadores inteligentes observadores de la evolución). Por lo tanto, existe un sesgo potencial en el registro de impacto de la Tierra. [17] Los riesgos existenciales astronómicos podrían igualmente subestimarse debido al sesgo de selección, y se debe introducir una corrección antrópica. [18]

Sesgo voluntario [ editar ]

El sesgo de autoselección o el sesgo voluntario en los estudios ofrecen más amenazas a la validez de un estudio, ya que estos participantes pueden tener características intrínsecamente diferentes de la población objetivo del estudio. [19] Los estudios han demostrado que los voluntarios tienden a provenir de una posición social más alta que de un entorno socioeconómico más bajo. [20] Además, otro estudio muestra que es más probable que las mujeres se ofrezcan como voluntarias para los estudios que los hombres. El sesgo de los voluntarios es evidente a lo largo del ciclo de vida del estudio, desde el reclutamiento hasta los seguimientos. En términos más generales, la respuesta de los voluntarios puede atribuirse al altruismo individual, el deseo de aprobación, la relación personal con el tema de estudio y otras razones. [20] [14]Como ocurre con la mayoría de los casos, la mitigación en el caso del sesgo de los voluntarios es un mayor tamaño de la muestra. [ cita requerida ]

Mitigación [ editar ]

En el caso general, los sesgos de selección no se pueden superar con el análisis estadístico de los datos existentes únicamente, aunque la corrección de Heckman se puede utilizar en casos especiales. Se puede evaluar el grado de sesgo de selección examinando las correlaciones entre las variables exógenas (de fondo) y un indicador de tratamiento. Sin embargo, en los modelos de regresión , es la correlación entre los determinantes no observados del resultado y los determinantes no observados de la selección en la muestra lo que sesga las estimaciones, y esta correlación entre los no observables no puede evaluarse directamente por los determinantes observados del tratamiento. [21]

Cuando se seleccionan datos con fines de ajuste o pronóstico, se puede configurar un juego de coalición para que se pueda definir una función de precisión de ajuste o pronóstico en todos los subconjuntos de las variables de datos.

Problemas relacionados [ editar ]

El sesgo de selección está estrechamente relacionado con:

  • sesgo de publicación o sesgo de informe , la distorsión producida en la percepción de la comunidad o en los metanálisis al no publicar resultados poco interesantes (generalmente negativos), o resultados que van en contra de los prejuicios del experimentador, los intereses de un patrocinador o las expectativas de la comunidad.
  • sesgo de confirmación , la tendencia general de los humanos a prestar más atención a todo aquello que confirme nuestra perspectiva preexistente; o específicamente en la ciencia experimental, la distorsión producida por experimentos que están diseñados para buscar evidencia confirmatoria en lugar de intentar refutar la hipótesis.
  • sesgo de exclusión, resultado de la aplicación de diferentes criterios a casos y controles con respecto a la elegibilidad para participar en un estudio / diferentes variables que sirven como base para la exclusión.

Ver también [ editar ]

  • La paradoja de Berkson  : la tendencia a malinterpretar experimentos estadísticos que involucran probabilidades condicionales
  •  Teoría del cisne negro - Teoría de la respuesta a eventos sorpresa
  • Selección de cerezas  : falacia de señalar casos individuales que parecen confirmar una posición mientras se ignoran los casos relacionados que pueden contradecir la posición.
  • Sesgo de financiación
  • Lista de sesgos cognitivos  : patrones sistemáticos de desviación de la norma o racionalidad en el juicio
  • Sesgo de participación
  • Sesgo de publicación  : mayor probabilidad de publicar resultados que muestren un hallazgo significativo
  • Sesgo de notificación
  • Sesgo de muestreo  : sesgo en el que se recopila una muestra de tal manera que algunos miembros de la población prevista tienen menos probabilidades de ser incluidos que otros.
  • Probabilidad de muestreo
  • Teoría de la exposición selectiva  : teoría en psicología que se refiere a la tendencia a favorecer la información que refuerza los puntos de vista preexistentes.
  • Profecía autocumplida  : predicción que hace que se haga realidad.
  • Sesgo de supervivencia  : error lógico, forma de sesgo de selección
  • Ilusión de frecuencia

Referencias [ editar ]

  1. ^ Diccionario de términos de cáncer → sesgo de selección . Consultado el 23 de septiembre de 2009.
  2. ^ Diccionario médico - 'Sampling Bias' obtenido el 23 de septiembre de 2009
  3. ^ TheFreeDictionary → muestra sesgada . Consultado el 23 de septiembre de 2009. El sitio a su vez cita: Diccionario médico de Mosby, octava edición.
  4. ^ Diccionario de términos de cáncer → Sesgo de selección . Consultado el 23 de septiembre de 2009.
  5. ^ Ards, Sheila; Chung, Chanjin; Myers, Samuel L. (1998). "Los efectos del sesgo de selección de la muestra sobre las diferencias raciales en los informes de abuso infantil". Abuso y negligencia infantil . 22 (2): 103-115. doi : 10.1016 / S0145-2134 (97) 00131-2 . PMID  9504213 .
  6. ^ Cortés, Corinna; Mohri, Mehryar; Riley, Michael; Rostamizadeh, Afshin (2008). Teoría de corrección de sesgo de selección de muestra (PDF) . Teoría del aprendizaje algorítmico . Apuntes de conferencias en Ciencias de la Computación. 5254 . págs. 38–53. arXiv : 0805.2775 . CiteSeerX 10.1.1.144.4478 . doi : 10.1007 / 978-3-540-87987-9_8 . ISBN   978-3-540-87986-2. S2CID  842488 .
  7. ^ Cortés, Corinna; Mohri, Mehryar (2014). "Teoría y algoritmo de regresión de adaptación de dominio y corrección de sesgo de muestra" (PDF) . Informática Teórica . 519 : 103-126. CiteSeerX 10.1.1.367.6899 . doi : 10.1016 / j.tcs.2013.09.027 .  
  8. ^ Fadem, Barbara (2009). Ciencias del comportamiento . Lippincott Williams y Wilkins. pag. 262. ISBN 978-0-7817-8257-9.
  9. ^ a b Feinstein AR; Horwitz RI (noviembre de 1978). "Una crítica de la evidencia estadística que asocia los estrógenos con el cáncer de endometrio". Cancer Res . 38 (11 Pt 2): 4001–5. PMID 698947 . 
  10. ^ Tamim H; Monfared AA; LeLorier J (marzo de 2007). "Aplicación de lag-time en las definiciones de exposición para controlar el sesgo protopático". Pharmacoepidemiol Drug Saf . 16 (3): 250–8. doi : 10.1002 / pds.1360 . PMID 17245804 . S2CID 25648490 .  
  11. ^ Matthew R. Weir (2005). Hipertensión (enfermedades clave) (Serie de enfermedades clave de la Acp) . Filadelfia, Pensilvania: Colegio Estadounidense de Médicos. pag. 159. ISBN 978-1-930513-58-7.
  12. ^ Kruskal, William H. (1960). "Algunas observaciones sobre observaciones salvajes" . Tecnometría . 2 (1): 1–3. doi : 10.1080 / 00401706.1960.10489875 .
  13. ↑ a b Jüni, P .; Egger, Matthias (2005). "Evidencia empírica de sesgo de deserción en ensayos clínicos" . Revista Internacional de Epidemiología . 34 (1): 87–88. doi : 10.1093 / ije / dyh406 . PMID 15649954 . 
  14. ^ a b Jordan, Sue; Watkins, Alan; Storey, Mel; Allen, Steven J .; Brooks, Caroline J .; Garaiova, Iveta; Heaven, Martin L .; Jones, Ruth; Plummer, Sue F .; Russell, Ian T .; Thornton, Catherine A. (9 de julio de 2013). "Sesgo voluntario en el reclutamiento, la retención y la donación de muestras de sangre en un ensayo controlado aleatorio que involucra a madres y sus hijos a los seis meses y dos años: un análisis longitudinal" . PLOS ONE . 8 (7): e67912. Código bibliográfico : 2013PLoSO ... 867912J . doi : 10.1371 / journal.pone.0067912 . ISSN 1932-6203 . PMC 3706448 . PMID   23874465 .
  15. Pequeño, WP (6 de mayo de 1967). "Perdido durante el seguimiento" . The Lancet . Publicado originalmente como Volumen 1, Número 7497. 289 (7497): 997–999. doi : 10.1016 / S0140-6736 (67) 92377-X . ISSN 0140-6736 . PMID 4164620 .  
  16. ^ Bostrom, Nick (2002). Sesgo antrópico: efectos de la selección de la observación en ciencia y filosofía . Nueva York: Routledge. ISBN 978-0-415-93858-7.
  17. ^ Ćirković, MM; Sandberg, A .; Bostrom, N. (2010). "Sombra antrópica: efectos de selección de observación y riesgos de extinción humana". Análisis de riesgo . 30 (10): 1495–506. doi : 10.1111 / j.1539-6924.2010.01460.x . PMID 20626690 . 
  18. Tegmark, M .; Bostrom, N. (2005). "Astrofísica: ¿Es probable una catástrofe del fin del mundo?". Naturaleza . 438 (7069): 754. Bibcode : 2005Natur.438..754T . doi : 10.1038 / 438754a . PMID 16341005 . S2CID 4390013 .  
  19. ^ Tripepi, Giovanni; Jager, Kitty J .; Dekker, Friedo W .; Zoccali, Carmine (2010). "Sesgo de selección y sesgo de información en la investigación clínica" . Práctica Clínica Nephron . 115 (2): c94 – c99. doi : 10.1159 / 000312871 . ISSN 1660-2110 . PMID 20407272 .  
  20. ^ a b "Sesgo voluntario" . Catálogo de sesgos . 2017-11-17 . Consultado el 29 de octubre de 2020 .
  21. ^ Heckman, JJ (1979). "Sesgo de selección de muestra como un error de especificación". Econometrica . 47 (1): 153-161. doi : 10.2307 / 1912352 . JSTOR 1912352 .