Distribución marginal


En teoría de probabilidad y estadística , la distribución marginal de un subconjunto de una colección de variables aleatorias es la distribución de probabilidad de las variables contenidas en el subconjunto. Da las probabilidades de varios valores de las variables en el subconjunto sin referencia a los valores de las otras variables. Esto contrasta con una distribución condicional , que da probabilidades sujetas a los valores de las otras variables.

Las variables marginales son aquellas variables en el subconjunto de variables que se retienen. Estos conceptos son "marginales" porque se pueden encontrar sumando valores en una tabla a lo largo de filas o columnas y escribiendo la suma en los márgenes de la tabla. [1] La distribución de las variables marginales (la distribución marginal) se obtiene marginando , es decir, centrándose en las sumas en el margen, sobre la distribución de las variables que se descartan, y se dice que las variables descartadas han sido marginadas .

El contexto aquí es que los estudios teóricos que se están realizando, o el análisis de datos que se está realizando, involucran un conjunto más amplio de variables aleatorias, pero que la atención se limita a un número reducido de esas variables. En muchas aplicaciones, un análisis puede comenzar con una colección dada de variables aleatorias, luego primero extender el conjunto definiendo nuevas (como la suma de las variables aleatorias originales) y finalmente reducir el número colocando interés en la distribución marginal de una variable aleatoria. subconjunto (como la suma). Se pueden realizar varios análisis diferentes, cada uno de los cuales trata un subconjunto diferente de variables como variables marginales.

Dada una distribución conjunta conocida de dos variables aleatorias discretas , digamos, X e Y , la distribución marginal de cualquiera de las variables - X por ejemplo - es la distribución de probabilidad de X cuando los valores de Y no se toman en consideración. Esto se puede calcular sumando la distribución de probabilidad conjunta sobre todos los valores de Y. Naturalmente, lo contrario también es cierto: la distribución marginal se puede obtener para Y sumando los valores separados de X.

Intuitivamente, la probabilidad marginal de X se calcula examinando la probabilidad condicional de X dado un valor particular de Y , y luego promediando esta probabilidad condicional sobre la distribución de todos los valores de Y.

Esto se deriva de la definición de valor esperado (después de aplicar la ley del estadístico inconsciente )


Muchas muestras de una distribución normal bivariada. Las distribuciones marginales se muestran en rojo y azul. La distribución marginal de X también se aproxima creando un histograma de las coordenadas X sin tener en cuenta las coordenadas Y.