Distribución normal


Una distribución normal es una distribución de probabilidad utilizada para modelar fenómenos que tienen un comportamiento predeterminado y posibles desviaciones acumulativas de ese comportamiento. Por ejemplo, se espera que las flechas de un arquero competente aterricen alrededor de la diana del objetivo; sin embargo, debido a las imperfecciones acumuladas en la técnica del arquero, la mayoría de las flechas fallarán en el blanco por cierta distancia. El promedio de esta distancia se conoce en tiro con arco como precisión , mientras que la cantidad de variación en las distancias como precisión . En el contexto de una distribución normal, la exactitud y la precisión se conocen como la media y ladesviación estándar , respectivamente. Por lo tanto, una medida estrecha de la competencia de un arquero se puede expresar con dos valores: una media y una desviación estándar. En una distribución normal, estos dos valores significan: hay una probabilidad de ~68 % de que una flecha caiga dentro de una desviación estándar de la precisión promedio del arquero; una probabilidad de ~95% de que una flecha caiga dentro de dos desviaciones estándar de la precisión promedio del arquero; ~99.7% dentro de tres; y así sucesivamente, aumentando lentamente hacia el 100%.

Más rigurosamente, en la teoría de la probabilidad , una distribución normal (también conocida como distribución de Gauss , Gauss o Laplace-Gauss ) es un tipo de distribución de probabilidad continua para una variable aleatoria de valor real . La forma general de su función de densidad de probabilidad es

El parámetro es la media o expectativa de la distribución (y también su mediana y moda ), mientras que el parámetro es su desviación estándar . La varianza de la distribución es . [1] Se dice que una variable aleatoria con una distribución gaussiana tiene una distribución normal y se denomina desviación normal .

Las distribuciones normales son importantes en estadística y se utilizan a menudo en las ciencias naturales y sociales para representar variables aleatorias de valor real cuyas distribuciones no se conocen. [2] [3] Su importancia se debe en parte al teorema del límite central . Establece que, bajo algunas condiciones, el promedio de muchas muestras (observaciones) de una variable aleatoria con media y varianza finitas es en sí misma una variable aleatoria, cuya distribución converge a una distribución normal a medida que aumenta el número de muestras. Por lo tanto, las cantidades físicas que se espera que sean la suma de muchos procesos independientes, como los errores de medición, a menudo tienen distribuciones que son casi normales. [4]

Además, las distribuciones gaussianas tienen algunas propiedades únicas que son valiosas en los estudios analíticos. Por ejemplo, cualquier combinación lineal de una colección fija de desviaciones normales es una desviación normal. Muchos resultados y métodos, como la propagación de la incertidumbre y el ajuste de parámetros por mínimos cuadrados , se pueden derivar analíticamente en forma explícita cuando las variables relevantes se distribuyen normalmente.


Para la distribución normal, los valores a menos de una desviación estándar de la media representan el 68,27% del conjunto; mientras que dos desviaciones estándar de la media dan cuenta del 95,45%; y tres desviaciones estándar representan el 99,73%.
A medida que aumenta el número de eventos discretos, la función comienza a parecerse a una distribución normal.
Comparación de funciones de densidad de probabilidad, para la suma de dados justos de 6 caras para mostrar su convergencia a una distribución normal con creciente , de acuerdo con el teorema del límite central. En el gráfico inferior derecho, los perfiles suavizados de los gráficos anteriores se vuelven a escalar, se superponen y se comparan con una distribución normal (curva negra).
a: Densidad de probabilidad de una función de variable normal con y . b: Densidad de probabilidad de una función de dos variables normales y , donde , , , y . c: Mapa de calor de la densidad de probabilidad conjunta de dos funciones de dos variables normales correlacionadas y , donde , , , y . d: Densidad de probabilidad de una función de 4 iid variables normales estándar. Estos se calculan mediante el método numérico de trazado de rayos. [39]
El estado fundamental de un oscilador armónico cuántico tiene la distribución gaussiana .
Histograma de anchos de sépalos para Iris versicolor del conjunto de datos de flores de Iris de Fisher , con distribución normal superpuesta de mejor ajuste.
Distribución normal acumulada ajustada a las lluvias de octubre, ver ajuste de distribución
La máquina de frijoles , un dispositivo inventado por Francis Galton , puede llamarse el primer generador de variables aleatorias normales. Esta máquina consta de un tablero vertical con filas de alfileres intercalados. Se dejan caer pequeñas bolas desde la parte superior y luego rebotan aleatoriamente hacia la izquierda o hacia la derecha cuando golpean los bolos. Las bolas se recogen en contenedores en la parte inferior y se asientan en un patrón que se asemeja a la curva de Gauss.
Carl Friedrich Gauss descubrió la distribución normal en 1809 como una forma de racionalizar el método de los mínimos cuadrados .
Pierre-Simon Laplace demostró el teorema del límite central en 1810, consolidando la importancia de la distribución normal en estadística.