La pseudorreplicación es el proceso de inflar artificialmente el número de muestras o réplicas. [1] Como resultado, las pruebas estadísticas realizadas sobre los datos se invalidan.
La pseudorreplicación fue definida originalmente en 1984 por Stuart H. Hurlbert [2] como un caso especial de especificación inadecuada de factores aleatorios donde están presentes tanto factores aleatorios como fijos. [3] El problema de la especificación inadecuada surge cuando los tratamientos se asignan a unidades que están submuestreadas y la relación F del tratamiento en una tabla de análisis de varianza ( ANOVA ) se forma con respecto al cuadrado medio residual en lugar de con respecto a la unidad entre cuadrado medio. La relación F en relación con el cuadrado medio de la unidad es vulnerable a la confusiónde tratamiento y efectos unitarios, especialmente cuando el número de unidades experimentales es pequeño (por ejemplo, cuatro unidades de tanque, dos tanques tratados, dos no tratados, varias submuestras por tanque). El problema se elimina formando la relación F relativa al cuadrado medio correcto en la tabla ANOVA (tanque por tratamiento MS en el ejemplo anterior), cuando esto sea posible. El problema se aborda mediante el uso de modelos mixtos. [3]
Hurlbert informó "pseudorreplicación" en el 48% de los estudios que examinó, que utilizaron estadísticas inferenciales. [2] Varios estudios que examinaron artículos científicos publicados hasta 2016 encontraron de manera similar que aproximadamente la mitad de los artículos eran sospechosos de pseudorreplicación. [1] Cuando el tiempo y los recursos limitan el número de unidades experimentales , y los efectos unitarios no pueden eliminarse estadísticamente probando la varianza unitaria, es importante utilizar otras fuentes de información para evaluar el grado en que una razón F se confunde por efectos unitarios.
Replicación
La replicación aumenta la precisión de una estimación, mientras que la aleatorización aborda la aplicabilidad más amplia de una muestra a una población. La replicación debe ser apropiada: se debe considerar la replicación a nivel de unidad experimental, además de la replicación dentro de las unidades.
Evaluación de la hipótesis
Las pruebas estadísticas (por ejemplo , la prueba t y la familia de pruebas ANOVA relacionada) se basan en la replicación adecuada para estimar la significancia estadística . Las pruebas basadas en las distribuciones ty F suponen errores homogéneos, normales e independientes. Los errores correlacionados pueden dar lugar a una precisión falsa y valores p demasiado pequeños. [4]
Tipos
Hurlbert (1984) definió cuatro tipos de pseudorreplicación.
- La pseudorreplicación simple (Figura 5a en Hurlbert 1984) ocurre cuando hay una unidad experimental por tratamiento. La estadística inferencial no puede separar la variabilidad debida al tratamiento de la variabilidad debida a las unidades experimentales cuando solo hay una medida por unidad.
- La pseudorreplicación temporal (Figura 5c en Hurlbert 1984) ocurre cuando las unidades experimentales difieren lo suficiente en el tiempo como para que los efectos temporales entre las unidades sean probables, y los efectos del tratamiento se correlacionan con los efectos temporales. La estadística inferencial no puede separar la variabilidad debida al tratamiento de la variabilidad debida a las unidades experimentales cuando solo hay una medida por unidad.
- La pseudorreplicación de sacrificio (Figura 5b en Hurlbert 1984) ocurre cuando las medias dentro de un tratamiento se utilizan en un análisis, y estas medias se prueban sobre la varianza dentro de la unidad. En la Figura 5b, la razón F errónea tendrá 1 gl en el cuadrado medio del numerador (tratamiento) y 4 gl en el cuadrado medio del denominador (2-1 = 1 gl para cada unidad experimental). La razón F correcta tendrá 1 gl en el numerador (tratamiento) y 2 gl en el denominador (2-1 = 1 gl para cada tratamiento). El cociente F correcto controla los efectos de las unidades experimentales, pero con 2 gl en el denominador tendrá poco poder para detectar diferencias de tratamiento.
- La pseudorreplicación implícita ocurre cuando los errores estándar (o límites de confianza) se estiman dentro de las unidades experimentales. Como ocurre con otras fuentes de pseudorreplicación, los efectos del tratamiento no pueden separarse estadísticamente de los efectos debido a la variación entre las unidades experimentales.
Referencias
- ↑ a b Gholipour, Bahar (15 de marzo de 2018). "Los errores estadísticos pueden contaminar hasta la mitad de los estudios con ratones" . Espectro | Noticias de investigación sobre el autismo . Consultado el 24 de marzo de 2018 .
- ^ a b Hurlbert, Stuart H. (1984). "Pseudorreplicación y el diseño de experimentos de campo ecológicos" (PDF) . Monografías ecológicas . Sociedad Ecológica de América. 54 (2): 187–211. doi : 10.2307 / 1942661 . JSTOR 1942661 .
- ^ a b Millar, RB; Anderson, MR (2004). "Remedios para la pseudorreplicación". Investigación pesquera . 70 (2–3): 397–407. doi : 10.1016 / j.fishres.2004.08.016 .
- ^ Lazic, SE (2010). "El problema de la pseudorreplicación en los estudios neurocientíficos: ¿está afectando su análisis?" . BMC Neuroscience . 11: 5 : 5. doi : 10.1186 / 1471-2202-11-5 . PMC 2817684 . PMID 20074371 .