Distribución de Dirichlet


En probabilidad y estadística , la distribución de Dirichlet (después de Peter Gustav Lejeune Dirichlet ), a menudo denotada , es una familia de distribuciones de probabilidad continuas multivariadas parametrizadas por un vector de reales positivos . Es una generalización multivariante de la distribución beta , [1] de ahí su nombre alternativo de distribución beta multivariante (MBD) . [2] Las distribuciones de Dirichlet se usan comúnmente como distribuciones previas en las estadísticas bayesianas . y, de hecho, la distribución de Dirichlet es la previa conjugada de la distribución categórica y la distribución multinomial .

La distribución de Dirichlet de orden K  ≥ 2 con parámetros α 1 , ..., α K > 0 tiene una función de densidad de probabilidad con respecto a la medida de Lebesgue en el espacio euclidiano R K-1 dada por

La constante de normalización es la función beta multivariante , que se puede expresar en términos de la función gamma :

El soporte de la distribución de Dirichlet es el conjunto de vectores K -dimensionales cuyas entradas son números reales en el intervalo (0,1) tales que , es decir, la suma de las coordenadas es igual a 1. Estos pueden verse como las probabilidades de una Evento categórico de la vía K. Otra forma de expresar esto es que el dominio de la distribución de Dirichlet es en sí mismo un conjunto de distribuciones de probabilidad , específicamente el conjunto de distribuciones discretas K -dimensionales . El término técnico para el conjunto de puntos en el soporte de una distribución de Dirichlet K -dimensional es el estándar abierto ( K  − 1)-simplex , [3] que es una generalización de un triángulo , incrustado en la próxima dimensión superior. Por ejemplo, con K  = 3, el soporte es un triángulo equilátero incrustado en un ángulo hacia abajo en un espacio tridimensional, con vértices en (1,0,0), (0,1,0) y (0,0 ,1), es decir tocando cada uno de los ejes de coordenadas en un punto a 1 unidad del origen.

Un caso especial común es la distribución simétrica de Dirichlet , donde todos los elementos que componen el vector de parámetros tienen el mismo valor. El caso simétrico puede ser útil, por ejemplo, cuando se requiere una prioridad de Dirichlet sobre los componentes, pero no hay un conocimiento previo que favorezca a un componente sobre otro. Dado que todos los elementos del vector de parámetros tienen el mismo valor, la distribución simétrica de Dirichlet se puede parametrizar mediante un solo valor escalar α , denominado parámetro de concentración . En términos de α, la función de densidad tiene la forma

Cuando α =1 [1] , la distribución simétrica de Dirichlet es equivalente a una distribución uniforme sobre el estándar abierto ( K  − 1)-simplex , es decir, es uniforme sobre todos los puntos en su soporte . Esta distribución particular se conoce como la distribución plana de Dirichlet . Los valores del parámetro de concentración por encima de 1 prefieren variantes que son distribuciones densas y uniformemente distribuidas, es decir, todos los valores dentro de una sola muestra son similares entre sí. Los valores del parámetro de concentración por debajo de 1 prefieren distribuciones dispersas, es decir, la mayoría de los valores dentro de una sola muestra estarán cerca de 0, y la gran mayoría de la masa se concentrará en unos pocos de los valores.


Ilustrando cómo cambia el logaritmo de la función de densidad cuando K  = 3 cuando cambiamos el vector α de α  = (0.3, 0.3, 0.3) a (2.0, 2.0, 2.0), manteniendo todos los valores individuales iguales entre sí.