Validez de la conclusión estadística

La validez de la conclusión estadística es el grado en que las conclusiones sobre la relación entre las variables basadas en los datos son correctas o "razonables". Esto comenzó siendo únicamente acerca de si la conclusión estadística sobre la relación de las variables era correcta, pero ahora hay un movimiento para avanzar hacia conclusiones "razonables" que utilizan: datos cuantitativos, estadísticos y cualitativos. ^[1] Fundamentalmente, pueden ocurrir dos tipos de errores: tipo I (encontrar una diferencia o correlación cuando no existe) y tipo II(no encuentra diferencia o correlación cuando existe). La validez de la conclusión estadística se refiere a las cualidades del estudio que hacen que este tipo de errores sea más probable. La validez de la conclusión estadística implica asegurar el uso de procedimientos de muestreo adecuados, pruebas estadísticas apropiadas y procedimientos de medición confiables. ^[2]^[3]^[4]

Amenazas comunes

Las amenazas más comunes a la validez de las conclusiones estadísticas son:

Poca potencia estadística

La potencia es la probabilidad de rechazar correctamente la hipótesis nula cuando es falsa (inversa de la tasa de error tipo II). Los experimentos con baja potencia tienen una mayor probabilidad de aceptar incorrectamente la hipótesis nula, es decir, cometer un error de tipo II y concluir que no hay efecto cuando realmente lo hay (es decir, hay una covariación real entre la causa y el efecto). El bajo poder estadístico ocurre cuando el tamaño de la muestra del estudio es demasiado pequeño dados otros factores ( tamaños de efecto pequeños , variabilidad de grupos grandes, medidas poco confiables, etc.).

Supuestos infringidos de las estadísticas de la prueba

La mayoría de las pruebas estadísticas (particularmente las estadísticas inferenciales ) involucran suposiciones sobre los datos que hacen que el análisis sea adecuado para probar una hipótesis . La violación de los supuestos de las pruebas estadísticas puede conducir a inferencias incorrectas sobre la relación causa-efecto. La solidez de una prueba indica qué tan sensible es a las violaciones. Las violaciones de los supuestos pueden hacer que las pruebas sean más o menos propensas a cometer errores de tipo I o II .

Dragado y el problema de la tasa de error

Cada prueba de hipótesis implica un riesgo establecido de un error de tipo I (la tasa alfa). Si un investigador busca o " draga " a través de sus datos, probando muchas hipótesis diferentes para encontrar un efecto significativo, está inflando su tasa de error tipo I. Cuanto más prueba el investigador repetidamente los datos, mayor es la posibilidad de observar un error de tipo I y hacer una inferencia incorrecta sobre la existencia de una relación.

Falta de fiabilidad de las medidas

Si las variables dependientes y / o independientes no se miden de manera confiable (es decir, con grandes cantidades de error de medición ), se pueden sacar conclusiones incorrectas.

Restricción de rango

La restricción de rango, como los efectos de suelo y techo o los efectos de selección , reduce la potencia del experimento y aumenta la posibilidad de un error de tipo II. ^[5] Esto se debe a que las correlaciones se atenúan (debilitan) por la variabilidad reducida (ver, por ejemplo, la ecuación para el coeficiente de correlación producto-momento de Pearson que utiliza la varianza de la puntuación en su estimación).

Heterogeneidad de las unidades en estudio

Una mayor heterogeneidad de los individuos que participan en el estudio también puede afectar las interpretaciones de los resultados al aumentar la varianza de los resultados u oscurecer las relaciones verdaderas (ver también error de muestreo ). Esto oscurece las posibles interacciones entre las características de las unidades y la relación causa-efecto.

Amenazas a la validez interna

Cualquier efecto que pueda afectar la validez interna de un estudio de investigación puede sesgar los resultados y afectar la validez de las conclusiones estadísticas alcanzadas. Estas amenazas a la validez interna incluyen la falta de confiabilidad de la implementación del tratamiento (falta de estandarización ) o la falta de control de variables extrañas .

Ver también

Referencias

^ Cozby, Paul C. (2009). Métodos en la investigación del comportamiento (décima ed.). Boston: Educación superior McGraw-Hill.
^ Cohen, RJ; Swerdlik, ME (2004). Pruebas y evaluaciones psicológicas (6ª edición) . Sídney: McGraw-Hill.
^ Cook, TD; Campbell, DT; Día, A. (1979). Cuasi-experimentación: problemas de diseño y análisis para entornos de campo . Houghton Mifflin .
^ Shadish, W .; Cook, TD; Campbell, DT (2006). Diseños experimentales y cuasiexperimentales para inferencia causal generalizada . Houghton Mifflin .
^ Sackett, PR; Lievens, F .; Berry, CM; Landers, Enfermera registrada (2007). "Una nota de advertencia sobre los efectos de la restricción de rango en las intercorrelaciones de predictores" (PDF) . Revista de Psicología Aplicada . 92 (2): 538–544. doi : 10.1037 / 0021-9010.92.2.538 . PMID 17371098 .

[Cozby-1] Cozby, Paul C. (2009). Métodos en la investigación del comportamiento (décima ed.). Boston: Educación superior McGraw-Hill.

[Cohen-2] Cohen, RJ; Swerdlik, ME (2004). Pruebas y evaluaciones psicológicas (6ª edición) . Sídney: McGraw-Hill.

[Cook-3] Cook, TD; Campbell, DT; Día, A. (1979). Cuasi-experimentación: problemas de diseño y análisis para entornos de campo . Houghton Mifflin .

[Shadish-4] Shadish, W .; Cook, TD; Campbell, DT (2006). Diseños experimentales y cuasiexperimentales para inferencia causal generalizada . Houghton Mifflin .

[Sackett-5] Sackett, PR; Lievens, F .; Berry, CM; Landers, Enfermera registrada (2007). "Una nota de advertencia sobre los efectos de la restricción de rango en las intercorrelaciones de predictores" (PDF) . Revista de Psicología Aplicada . 92 (2): 538–544. doi : 10.1037 / 0021-9010.92.2.538 . PMID 17371098 .

[1]