El ajuste de distribución de probabilidad o simplemente el ajuste de distribución es el ajuste de una distribución de probabilidad a una serie de datos relacionados con la medición repetida de un fenómeno variable.
El objetivo del ajuste de distribución es predecir la probabilidad o pronosticar la frecuencia de ocurrencia de la magnitud del fenómeno en un cierto intervalo.
Hay muchas distribuciones de probabilidad (ver lista de distribuciones de probabilidad ) de las cuales algunas pueden ajustarse más estrechamente a la frecuencia observada de los datos que otras, dependiendo de las características del fenómeno y de la distribución. Se supone que la distribución que proporciona un ajuste perfecto conduce a buenas predicciones.
La selección de la distribución apropiada depende de la presencia o ausencia de simetría del conjunto de datos con respecto a la tendencia central .
Cuando los datos se distribuyen simétricamente alrededor de la media mientras que la frecuencia de aparición de datos más alejados de la media disminuye, se puede, por ejemplo, seleccionar la distribución normal , la distribución logística o la distribución t de Student . Los dos primeros son muy similares, mientras que el último, con un grado de libertad, tiene "colas más pesadas", lo que significa que los valores más alejados de la media ocurren con relativa más frecuencia (es decir, la curtosis es más alta). La distribución de Cauchy también es simétrica.
Cuando los valores más grandes tienden a estar más lejos de la media que los valores más pequeños, uno tiene una distribución sesgada hacia la derecha (es decir, hay una asimetría positiva ), uno puede, por ejemplo, seleccionar la distribución logarítmica normal (es decir, los valores logarítmicos de la los datos están distribuidos normalmente ), la distribución log-logística (es decir, los valores logarítmicos de los datos siguen una distribución logística ), la distribución de Gumbel , la distribución exponencial , la distribución de Pareto , la distribución de Weibull , la distribución de Burr o la distribución de Fréchet. Las últimas cuatro distribuciones están limitadas a la izquierda.