regla 68–95–99.7


En estadística , la regla 68–95–99,7 , también conocida como regla empírica , es una forma abreviada que se usa para recordar el porcentaje de valores que se encuentran dentro de una estimación de intervalo en una distribución normal : 68 %, 95 % y 99,7 % de la los valores se encuentran dentro de una, dos y tres desviaciones estándar de la media , respectivamente.

En notación matemática, estos hechos se pueden expresar de la siguiente manera, donde Pr() es la función de probabilidad, [1] Χ es una observación de una variable aleatoria normalmente distribuida , μ es la media de la distribución y σ es su desviación estándar:

En las ciencias empíricas , la llamada regla general de tres sigma expresa una heurística convencional de que casi todos los valores se toman dentro de tres desviaciones estándar de la media y, por lo tanto, es empíricamente útil tratar el 99,7% de probabilidad como una certeza cercana. [2]

En las ciencias sociales , un resultado puede considerarse " significativo " si su nivel de confianza es del orden de un efecto de dos sigma (95 %), mientras que en física de partículas existe la convención de un efecto de cinco sigma (99,99994 %). confianza) siendo requerido para calificar como un descubrimiento .

Se puede derivar una regla de tres sigma más débil de la desigualdad de Chebyshev , que establece que incluso para variables que no se distribuyen normalmente, al menos el 88,8% de los casos deben caer dentro de intervalos de tres sigma calculados correctamente. Para distribuciones unimodales , la probabilidad de estar dentro del intervalo es de al menos el 95% por la desigualdad de Vysochanskij-Petunin . Puede haber ciertos supuestos para una distribución que obliguen a que esta probabilidad sea al menos del 98 %. [3]

Estos valores numéricos "68%, 95%, 99,7%" provienen de la función de distribución acumulada de la distribución normal .


Para un conjunto de datos aproximadamente normal , los valores dentro de una desviación estándar de la media representan aproximadamente el 68 % del conjunto; mientras que dentro de dos desviaciones estándar representan alrededor del 95%; y dentro de tres desviaciones estándar representan alrededor del 99,7%. Los porcentajes mostrados son probabilidades teóricas redondeadas destinadas únicamente a aproximar los datos empíricos derivados de una población normal.
Intervalo de predicción (en el eje y ) dado a partir de la puntuación estándar (en el eje x ). El eje y está escalado logarítmicamente (pero los valores en él no se modifican).
Diagrama que muestra la función de distribución acumulada para la distribución normal con media ( μ ) 0 y varianza ( σ 2 ) 1