La ciencia incómoda , identificada por el estadístico John Tukey , [1] [2] comprende situaciones en las que es necesario hacer una inferencia a partir de una muestra limitada de datos , donde no estarán disponibles más muestras influenciadas por el mismo sistema de causas . Más específicamente, se implica el análisis de un fenómeno natural finito para los que es difícil superar el problema de la utilización de una muestra común de datos para ambos análisis exploratorio de datos y análisis de datos de confirmación . Esto conduce al peligro de un sesgo sistemático a través deprobar hipótesis sugeridas por los datos .
Un ejemplo típico es la ley de Bode , que proporciona una regla numérica simple para las distancias de los planetas del sistema solar al Sol . Una vez que se ha derivado la regla, a través del emparejamiento de prueba y error de varias reglas con los datos observados (análisis de datos exploratorios), no quedan planetas suficientes para una prueba rigurosa e independiente de la hipótesis (análisis de datos confirmatorios). Hemos agotado los fenómenos naturales . La concordancia entre los datos y la regla numérica no debería sorprendernos, ya que hemos elegido deliberadamente la regla para que coincida con los datos. Si nos preocupa lo que nos dice la ley de Bode sobre el sistema de distribución planetario de causa, entonces exigimos una confirmación de que no estará disponible hasta que se disponga de mejor información sobre otros sistemas planetarios.
Ver también
- Varianza cósmica para un ejemplo extremo de este fenómeno.
- Procesamiento de datos
Bibliografía
- Diaconis, P. (1985). "Teorías del análisis de datos: desde el pensamiento mágico hasta la estadística clásica". En Hoaglin, DC; et al. (eds.). Exploración de tendencias y formas de tablas de datos . Wiley. ISBN 0-471-09776-4.
Referencias
- ^ Norel, R .; Rice, JJ; Stolovitzky, G. (2011). "La trampa de la autoevaluación: ¿podemos todos ser mejores que el promedio?" . Biología de sistemas moleculares . 7 : 537. doi : 10.1038 / msb.2011.70 . PMC 3261704 . PMID 21988833 .
- ^ Hoaglin, DC; et al. (eds.). Exploración de tendencias y formas de tablas de datos . Wiley. ISBN 0-471-09776-4.
Gran parte de la ciencia también cae bajo la etiqueta de John Tukey "ciencia incómoda", porque la repetición real no es factible ni práctica.