Ajuste de distribución de probabilidad


El ajuste de distribución de probabilidad o simplemente el ajuste de distribución es el ajuste de una distribución de probabilidad a una serie de datos relacionados con la medición repetida de un fenómeno variable.

El objetivo del ajuste de distribución es predecir la probabilidad o pronosticar la frecuencia de ocurrencia de la magnitud del fenómeno en un cierto intervalo.

Hay muchas distribuciones de probabilidad (ver lista de distribuciones de probabilidad ) de las cuales algunas pueden ajustarse más estrechamente a la frecuencia observada de los datos que otras, dependiendo de las características del fenómeno y de la distribución. Se supone que la distribución que proporciona un ajuste perfecto conduce a buenas predicciones.

La selección de la distribución apropiada depende de la presencia o ausencia de simetría del conjunto de datos con respecto a la tendencia central .

Cuando los datos se distribuyen simétricamente alrededor de la media mientras que la frecuencia de aparición de datos más alejados de la media disminuye, se puede, por ejemplo, seleccionar la distribución normal , la distribución logística o la distribución t de Student . Los dos primeros son muy similares, mientras que el último, con un grado de libertad, tiene "colas más pesadas", lo que significa que los valores más alejados de la media ocurren con relativa más frecuencia (es decir, la curtosis es más alta). La distribución de Cauchy también es simétrica.

Cuando los valores más grandes tienden a estar más lejos de la media que los valores más pequeños, uno tiene una distribución sesgada hacia la derecha (es decir, hay una asimetría positiva ), uno puede, por ejemplo, seleccionar la distribución logarítmica normal (es decir, los valores logarítmicos de la los datos están distribuidos normalmente ), la distribución log-logística (es decir, los valores logarítmicos de los datos siguen una distribución logística ), la distribución de Gumbel , la distribución exponencial , la distribución de Pareto , la distribución de Weibull , la distribución de Burr o la distribución de Fréchet. Las últimas cuatro distribuciones están limitadas a la izquierda.


Diferentes formas de la distribución normal simétrica en función de la media μ y la varianza σ  2
Asimetría a izquierda y derecha
Distribución de Gumbel acumulada ajustada a las precipitaciones máximas de un día de octubre en Surinam mediante el método de regresión con banda de confianza adicional utilizando cumfreq
(A) La distribución de probabilidad de Gumbel se inclina hacia la derecha y (B) Gumbel se inclina en espejo hacia la izquierda
Distribución compuesta (discontinua) con cinturón de confianza [9]
Análisis de incertidumbre con cinturones de confianza utilizando la distribución binomial [10]
Variaciones de nueve curvas de período de retorno de muestras de 50 años de un registro teórico de 1000 años (línea de base), datos de Benson [11]
Lista de distribuciones de probabilidad clasificadas por bondad de ajuste. [12]
Histograma y densidad de probabilidad de un conjunto de datos que se ajusta a la distribución GEV