En las pruebas de hipótesis estadísticas , p-rep o p rep se ha propuesto como una alternativa estadística al valor p clásico . [1] Mientras que un valor p es la probabilidad de obtener un resultado bajo la hipótesis nula, p-rep pretende calcular la probabilidad de replicar un efecto. La derivación de p-rep contenía errores matemáticos significativos.
Durante un tiempo, la Association for Psychological Science recomendó que los artículos enviados a Psychological Science y sus otras revistas informaran p-rep en lugar del clásico valor p, [2] pero este ya no es el caso. [3]
Cálculo
El valor de p-rep ( p rep ) se puede aproximar en función del valor de p ( p ) de la siguiente manera:
Crítica
El hecho de que p-rep tenga una correspondencia uno a uno con el valor p deja en claro que esta nueva medida no aporta información adicional más allá de la que transmite la importancia del resultado. Killeen reconoce esta falta de información, pero sugiere que p-rep capta mejor la forma en que los experimentadores ingenuos conceptualizan los valores p y las pruebas de hipótesis estadísticas .
Entre las críticas a p-rep está el hecho de que, si bien intenta estimar la replicabilidad, ignora los resultados de otros estudios que pueden orientar con precisión esta estimación. [4] Por ejemplo, un experimento sobre algún fenómeno paranormal poco probable puede producir una p-rep de 0,75. La mayoría de la gente aún no concluiría que la probabilidad de una réplica es del 75%. Más bien, concluirían que está mucho más cerca de 0: las afirmaciones extraordinarias requieren evidencia extraordinaria, y p-rep ignora esto. Debido a esto, p-rep puede de hecho ser más difícil de interpretar que un valor p clásico. El hecho de que p-rep requiera supuestos sobre probabilidades previas para que sea válido hace que su interpretación sea compleja. Killeen sostiene que los nuevos resultados deben evaluarse por derecho propio, sin la "carga de la historia", con planos previos: eso es lo que rinde p-rep. Una estimación más pragmática de la replicabilidad incluiría conocimientos previos, mediante, por ejemplo, el metanálisis .
Los críticos también han subrayado errores matemáticos en el artículo original de Killeen. Por ejemplo, la fórmula que relaciona los tamaños del efecto de dos réplicas de un experimento dado utiliza erróneamente una de estas variables aleatorias como parámetro de la distribución de probabilidad de la otra, mientras que previamente planteó la hipótesis de que estas dos variables eran independientes , [5] críticas abordadas en Dúplica de Killeen. [6]
Otra crítica de la estadística p-rep involucra la lógica de la experimentación. El valor científico de los datos replicables radica en la contabilidad adecuada de factores no medidos previamente (por ejemplo, variables de los participantes no medidos, sesgo del experimentador , etc.). La idea de que un solo estudio puede capturar una probabilidad lógica de tales factores no medidos que afectan el resultado y, por lo tanto, la probabilidad de replicabilidad, es una falacia lógica. [ cita requerida ]
Referencias
- ^ Killeen PR (2005). "Una alternativa a las pruebas de significación de hipótesis nula" . Ciencia psicológica . 16 (5): 345–53. doi : 10.1111 / j.0956-7976.2005.01538.x . PMC 1473027 . PMID 15869691 .
- ^ versión archivada de "Psychological Science Journal, Author Guidelines"
- ^ Revista de ciencia psicológica, directrices para el autor.
- ^ Macdonald, RR (2005) "Por qué las probabilidades de replicación dependen de distribuciones de probabilidad anteriores" Ciencia psicológica , 2005, 16, 1006-1008 [1] [ enlace muerto ]
- ^ "p-rep" en Estadísticas Pro Bono
- ^ Killeen, PR (2005) "Replicabilidad, confianza y priores", Ciencia psicológica , 2005, 16, 1009-1012 [2]