Distribución de Dirichlet agrupada


En estadística , la distribución de Dirichlet agrupada (GDD) es una generalización multivariante de la distribución de Dirichlet . Fue descrita por primera vez por Ng et al. 2008. [1] La distribución de Dirichlet agrupada surge en el análisis de datos categóricos donde algunas observaciones podrían caer en cualquiera de un conjunto de otra categoría 'crujiente'. Por ejemplo, uno puede tener un conjunto de datos que consta de casos y controles en dos condiciones diferentes. Con datos completos, la clasificación cruzada del estado de la enfermedad forma una tabla 2 (caso/control)-x-(condición/sin condición) con probabilidades de celda

Sin embargo, si los datos incluyen, por ejemplo, no respondedores que se sabe que son controles o casos, entonces la clasificación cruzada del estado de la enfermedad forma una tabla de 2 x 3. La probabilidad de la última columna es la suma de las probabilidades de las dos primeras columnas de cada fila, por ejemplo

Considere el conjunto símplex cerrado y . Escribiendo para los primeros elementos de un miembro de , la distribución de para dos particiones tiene una función de densidad dada por