Independencia condicional

En la teoría de la probabilidad , la independencia condicional describe situaciones en las que una observación es irrelevante o redundante al evaluar la certeza de una hipótesis. La independencia condicional se suele formular en términos de probabilidad condicional , como un caso especial en el que la probabilidad de la hipótesis dada la observación no informativa es igual a la probabilidad sin. Si ${\ Displaystyle A}$ es la hipótesis, y ${\ Displaystyle B}$ y ${\ Displaystyle C}$ son observaciones, la independencia condicional se puede establecer como una igualdad:

{\ Displaystyle P (A | B, C) = P (A | C)}

dónde ${\ Displaystyle P (A | B, C)}$ es la probabilidad de ${\ Displaystyle A}$ dado ambos ${\ Displaystyle B}$ y ${\ Displaystyle C}$ . Dado que la probabilidad de ${\ Displaystyle A}$ dado ${\ Displaystyle C}$ es la misma que la probabilidad de ${\ Displaystyle A}$ dado ambos ${\ Displaystyle B}$ y ${\ Displaystyle C}$ , esta igualdad expresa que ${\ Displaystyle B}$ no aporta nada a la certeza de ${\ Displaystyle A}$ . En este caso, ${\ Displaystyle A}$ y ${\ Displaystyle B}$ se dice que son condicionalmente independientes dado ${\ Displaystyle C}$ , escrito simbólicamente como: ${\ Displaystyle (A \ perp \! \! \! \ perp B | C)}$ .

El concepto de independencia condicional es esencial para las teorías de inferencia estadística basadas en gráficos, ya que establece una relación matemática entre una colección de enunciados condicionales y un grafoide .

Independencia condicional de eventos

Dejar ${\ Displaystyle A}$ , ${\ Displaystyle B}$ , y ${\ Displaystyle C}$ ser eventos . ${\ Displaystyle A}$ y ${\ Displaystyle B}$ se dice que son condicionalmente independientes dado ${\ Displaystyle C}$ si y solo si ${\ Displaystyle P (C)> 0}$ y:

{\ Displaystyle P (A \ mid B, C) = P (A \ mid C)}

Esta propiedad a menudo se escribe: ${\ Displaystyle (A \ perp \! \! \! \ perp B \ mid C)}$ .

De manera equivalente, la independencia condicional puede expresarse como:

{\ Displaystyle P (A, B | C) = P (A | C) P (B | C)}

dónde ${\ Displaystyle P (A, B | C)}$ es la probabilidad conjunta de ${\ Displaystyle A}$ y ${\ Displaystyle B}$ dado ${\ Displaystyle C}$ . Esta formulación alternativa establece que ${\ Displaystyle A}$ y ${\ Displaystyle B}$ son eventos independientes , dado ${\ Displaystyle C}$ .

Prueba de la definición equivalente

{\ Displaystyle P (A, B \ mid C) = P (A \ mid C) P (B \ mid C)}

si

{\ Displaystyle {\ frac {P (A, B, C)} {P (C)}} = ({\ frac {P (A, C)} {P (C)}}) ({\ frac {P (B, C)} {P (C)}})}

(definición de probabilidad condicional )

si

{\ Displaystyle P (A, B, C) = {\ frac {P (A, C) P (B, C)} {P (C)}}}

(multiplica ambos lados por

{\ Displaystyle P (C)}

)

si

{\ Displaystyle {\ frac {P (A, B, C)} {P (B, C)}} = {\ frac {P (A, C)} {P (C)}}}

(divide ambos lados por

{\ Displaystyle P (B, C)}

)

si

{\ Displaystyle P (A \ mid B, C) = P (A \ mid C)}

(definición de probabilidad condicional)

{\ Displaystyle \ por lo tanto}

Ejemplos de

La discusión sobre StackExchange proporciona un par de ejemplos útiles. Vea abajo. ^[1]

Cajas de colores

Cada celda representa un posible resultado. Los eventos ${\ Displaystyle \ color {rojo} R}$ , ${\ Displaystyle \ color {azul} B}$ y ${\ Displaystyle \ color {dorado} Y}$ están representados por las áreas sombreadas en rojo , azul y amarillo, respectivamente. La superposición entre los eventos ${\ Displaystyle \ color {rojo} R}$ y ${\ Displaystyle \ color {azul} B}$ está sombreado de púrpura .

These are two examples illustrating conditional independence.

Las probabilidades de estos eventos son áreas sombreadas con respecto al área total. En ambos ejemplos ${\ Displaystyle \ color {rojo} R}$ y ${\ Displaystyle \ color {azul} B}$ son condicionalmente independientes dado ${\ Displaystyle \ color {dorado} Y}$ porque:

{\ Displaystyle \ Pr ({\ color {rojo} R}, {\ color {azul} B} \ mid {\ color {dorado} Y}) = \ Pr ({\ color {rojo} R} \ mid {\ color {dorado} Y}) \ Pr ({\ color {azul} B} \ mid {\ color {dorado} Y})}

^[2]

pero no condicionalmente independiente dado ${\ Displaystyle \ left [{\ text {not}} {\ color {gold} Y} \ right]}$ porque:

{\ Displaystyle \ Pr ({\ color {rojo} R}, {\ color {azul} B} \ mid {\ text {not}} {\ color {dorado} Y}) \ not = \ Pr ({\ color {rojo} R} \ mid {\ text {not}} {\ color {dorado} Y}) \ Pr ({\ color {azul} B} \ mid {\ text {not}} {\ color {dorado} Y })}

Clima y retrasos

Supongamos que los dos eventos son las probabilidades de que las personas A y B lleguen a casa a tiempo para cenar, y el tercer evento es el hecho de que una tormenta de nieve azotó la ciudad. Si bien tanto A como B tienen una probabilidad más baja de llegar a casa a tiempo para la cena, las probabilidades más bajas seguirán siendo independientes entre sí. Es decir, el conocimiento de que A llega tarde no le dice si B llegará tarde. (Pueden estar viviendo en diferentes vecindarios, viajando diferentes distancias y usando diferentes medios de transporte). Sin embargo, si tiene información de que viven en el mismo vecindario, usan el mismo transporte y trabajan en el mismo lugar, entonces los dos los eventos NO son condicionalmente independientes.

Rodando dados

La independencia condicional depende de la naturaleza del tercer evento. Si tira dos dados, se puede suponer que los dos dados se comportan de forma independiente. Mirar los resultados de un dado no le dirá sobre el resultado del segundo dado. (Es decir, los dos dados son independientes). Sin embargo, si el resultado del primer dado es un 3 y alguien le informa sobre un tercer evento, que la suma de los dos resultados es par, entonces esta unidad adicional de información restringe la opciones para el segundo resultado a un número impar. En otras palabras, dos eventos pueden ser independientes, pero NO condicionalmente independientes.

Altura y vocabulario

La altura y el vocabulario son dependientes ya que las personas muy pequeñas tienden a ser niños, conocidos por sus vocabularios más básicos. Pero sabiendo que dos personas tienen 19 años (es decir, condicional a la edad), no hay razón para pensar que el vocabulario de una persona es más grande si se nos dice que es más alto.

Independencia condicional de variables aleatorias

Dos variables aleatorias ${\ Displaystyle X}$ y ${\ Displaystyle Y}$ son condicionalmente independientes dada una tercera variable aleatoria discreta ${\ Displaystyle Z}$ si y solo si son independientes en su distribución de probabilidad condicional dada ${\ Displaystyle Z}$ . Es decir, ${\ Displaystyle X}$ y ${\ Displaystyle Y}$ son condicionalmente independientes dado ${\ Displaystyle Z}$ si y solo si, dado cualquier valor de ${\ Displaystyle Z}$ , la distribución de probabilidad de ${\ Displaystyle X}$ es el mismo para todos los valores de ${\ Displaystyle Y}$ y la distribución de probabilidad de ${\ Displaystyle Y}$ es el mismo para todos los valores de ${\ Displaystyle X}$ . Formalmente:

{\ Displaystyle (X \ perp \! \! \! \ perp Y) \ mid Z \ quad \ iff \ quad F_ {X, Y \, \ mid \, Z \, = \, z} (x, y) = F_ {X \, \ mid \, Z \, = \, z} (x) \ cdot F_ {Y \, \ mid \, Z \, = \, z} (y) \ quad {\ text {para todos}} x, y, z}

( Ecuación 2 )

dónde ${\ Displaystyle F_ {X, Y \, \ mid \, Z \, = \, z} (x, y) = \ Pr (X \ leq x, Y \ leq y \ mid Z = z)}$ es la función de distribución acumulativa condicional de ${\ Displaystyle X}$ y ${\ Displaystyle Y}$ dado ${\ Displaystyle Z}$ .

Dos eventos ${\ Displaystyle R}$ y ${\ Displaystyle B}$ son condicionalmente independientes dada una σ-álgebra ${\ Displaystyle \ Sigma}$ Si

{\ Displaystyle \ Pr (R, B \ mid \ Sigma) = \ Pr (R \ mid \ Sigma) \ Pr (B \ mid \ Sigma) {\ text {as}}}

dónde ${\ Displaystyle \ Pr (A \ mid \ Sigma)}$ denota la expectativa condicional de la función indicadora del evento ${\ Displaystyle A}$ , ${\ Displaystyle \ chi _ {A}}$ , dado el álgebra sigma ${\ Displaystyle \ Sigma}$ . Es decir,

{\ Displaystyle \ Pr (A \ mid \ Sigma): = \ operatorname {E} [\ chi _ {A} \ mid \ Sigma].}

Dos variables aleatorias ${\ Displaystyle X}$ y ${\ Displaystyle Y}$ son condicionalmente independientes dada una σ-álgebra ${\ Displaystyle \ Sigma}$ si la ecuación anterior es válida para todos ${\ Displaystyle R}$ en ${\ Displaystyle \ sigma (X)}$ y ${\ Displaystyle B}$ en ${\ Displaystyle \ sigma (Y)}$ .

Dos variables aleatorias ${\ Displaystyle X}$ y ${\ Displaystyle Y}$ son condicionalmente independientes dada una variable aleatoria ${\ Displaystyle W}$ si son independientes dado σ ( W ): el σ-álgebra generada por ${\ Displaystyle W}$ . Esto se escribe comúnmente:

{\ Displaystyle X \ perp \! \! \! \ perp Y \ mid W}

o

{\ Displaystyle X \ perp Y \ mid W}

Esto se lee " ${\ Displaystyle X}$ es independiente de ${\ Displaystyle Y}$ , dado ${\ Displaystyle W}$ "; el condicionamiento se aplica a toda la declaración:" ( ${\ Displaystyle X}$ es independiente de ${\ Displaystyle Y}$ ) dado ${\ Displaystyle W}$ ".

{\ Displaystyle (X \ perp \! \! \! \ perp Y) \ mid W}

Si ${\ Displaystyle W}$ asume un conjunto contable de valores, esto es equivalente a la independencia condicional de X e Y para los eventos de la forma ${\ Displaystyle [W = w]}$ . La independencia condicional de más de dos eventos, o de más de dos variables aleatorias, se define de forma análoga.

Los siguientes dos ejemplos muestran que ${\ Displaystyle X \ perp \! \! \! \ perp Y}$ ni implica ni está implícito por ${\ Displaystyle (X \ perp \! \! \! \ perp Y) \ mid W}$ . Primero, suponga ${\ Displaystyle W}$ es 0 con probabilidad de 0,5 y 1 en caso contrario. Cuando W = 0 toma ${\ Displaystyle X}$ y ${\ Displaystyle Y}$ para ser independientes, cada uno tiene el valor 0 con probabilidad 0,99 y el valor 1 en caso contrario. Cuándo ${\ Displaystyle W = 1}$ , ${\ Displaystyle X}$ y ${\ Displaystyle Y}$ son de nuevo independientes, pero esta vez toman el valor 1 con probabilidad 0,99. Luego ${\ Displaystyle (X \ perp \! \! \! \ perp Y) \ mid W}$ . Pero ${\ Displaystyle X}$ y ${\ Displaystyle Y}$ son dependientes, porque Pr ( X = 0) X = 0 | Y = 0). Esto se debe a que Pr ( X = 0) = 0.5, pero si Y = 0, entonces es muy probable que W = 0 y, por lo tanto, X = 0 también, por lo que Pr ( X = 0 | Y = 0)> 0.5. Para el segundo ejemplo, suponga ${\ Displaystyle X \ perp \! \! \! \ perp Y}$ , cada uno tomando los valores 0 y 1 con probabilidad 0.5. Dejar ${\ Displaystyle W}$ ser el producto ${\ Displaystyle X \ cdot Y}$ . Entonces cuando ${\ Displaystyle W = 0}$ , Pr ( X = 0) = 2/3, pero Pr ( X = 0 | Y = 0) = 1/2, entonces ${\ Displaystyle (X \ perp \! \! \! \ perp Y) \ mid W}$ Es falso. Este es también un ejemplo de Explicación. Vea el tutorial de Kevin Murphy ^[3] donde ${\ Displaystyle X}$ y ${\ Displaystyle Y}$ tomar los valores "inteligente" y "deportivo".

Independencia condicional de vectores aleatorios

Dos vectores aleatorios ${\ Displaystyle \ mathbf {X} = (X_ {1}, \ ldots, X_ {l}) ^ {\ mathrm {T}}}$ y ${\ Displaystyle \ mathbf {Y} = (Y_ {1}, \ ldots, Y_ {m}) ^ {\ mathrm {T}}}$ son condicionalmente independientes dado un tercer vector aleatorio ${\ Displaystyle \ mathbf {Z} = (Z_ {1}, \ ldots, Z_ {n}) ^ {\ mathrm {T}}}$ si y solo si son independientes en su distribución acumulativa condicional dada ${\ Displaystyle \ mathbf {Z}}$ . Formalmente:

{\ Displaystyle (\ mathbf {X} \ perp \! \! \! \ perp \ mathbf {Y}) \ mid \ mathbf {Z} \ quad \ iff \ quad F _ {\ mathbf {X}, \ mathbf {Y } | \ mathbf {Z} = \ mathbf {z}} (\ mathbf {x}, \ mathbf {y}) = F _ {\ mathbf {X} \, \ mid \, \ mathbf {Z} \, = \ , \ mathbf {z}} (\ mathbf {x}) \ cdot F _ {\ mathbf {Y} \, \ mid \, \ mathbf {Z} \, = \, \ mathbf {z}} (\ mathbf {y }) \ quad {\ text {para todos}} \ mathbf {x}, \ mathbf {y}, \ mathbf {z}}

( Ecuación 3 )

dónde ${\ Displaystyle \ mathbf {x} = (x_ {1}, \ ldots, x_ {l}) ^ {\ mathrm {T}}}$ , ${\ Displaystyle \ mathbf {y} = (y_ {1}, \ ldots, y_ {m}) ^ {\ mathrm {T}}}$ y ${\ Displaystyle \ mathbf {z} = (z_ {1}, \ ldots, z_ {n}) ^ {\ mathrm {T}}}$ y las distribuciones acumulativas condicionales se definen como sigue.

{\ Displaystyle {\ begin {alineado} F _ {\ mathbf {X}, \ mathbf {Y} \, \ mid \, \ mathbf {Z} \, = \, \ mathbf {z}} (\ mathbf {x} , \ mathbf {y}) & = \ Pr (X_ {1} \ leq x_ {1}, \ ldots, X_ {l} \ leq x_ {l}, Y_ {1} \ leq y_ {1}, \ ldots , Y_ {m} \ leq y_ {m} \ mid Z_ {1} = z_ {1}, \ ldots, Z_ {n} = z_ {n}) \\ [6pt] F _ {\ mathbf {X} \, \ mid \, \ mathbf {Z} \, = \, \ mathbf {z}} (\ mathbf {x}) & = \ Pr (X_ {1} \ leq x_ {1}, \ ldots, X_ {l} \ leq x_ {l} \ mid Z_ {1} = z_ {1}, \ ldots, Z_ {n} = z_ {n}) \\ [6pt] F _ {\ mathbf {Y} \, \ mid \, \ mathbf {Z} \, = \, \ mathbf {z}} (\ mathbf {y}) & = \ Pr (Y_ {1} \ leq y_ {1}, \ ldots, Y_ {m} \ leq y_ {m } \ mid Z_ {1} = z_ {1}, \ ldots, Z_ {n} = z_ {n}) \ end {alineado}}}

Usos en inferencia bayesiana

Sea p la proporción de votantes que votarán "sí" en un próximo referéndum . Al realizar una encuesta de opinión , uno elige n votantes al azar de la población. Para i = 1,…, n , sea X _i = 1 o 0 correspondiente, respectivamente, a si el i- ésimo votante elegido votará "sí" o no.

En un enfoque frecuentista de la inferencia estadística, uno no atribuiría ninguna distribución de probabilidad ap (a menos que las probabilidades pudieran interpretarse de alguna manera como frecuencias relativas de ocurrencia de algún evento o como proporciones de alguna población) y se diría que X ₁ ,…, X _n son variables aleatorias independientes .

Por el contrario, en un bayesiano enfoque de la inferencia estadística, se podría asignar una distribución de probabilidad de p , independientemente de la no existencia de tal interpretación "frecuencia", y uno podría interpretar las probabilidades como grados de creencia de que p es en cualquier intervalo de a la que se le asigna una probabilidad. En ese modelo, las variables aleatorias X ₁ ,…, X _n no son independientes, pero son condicionalmente independientes dado el valor de p . En particular, si se observa que un gran número de X es igual a 1, eso implicaría una alta probabilidad condicional , dada esa observación, de que p está cerca de 1 y, por lo tanto, una alta probabilidad condicional , dada esa observación, que el la siguiente X a observar será igual a 1.

Reglas de independencia condicional

De la definición básica se ha derivado un conjunto de reglas que gobiernan las declaraciones de independencia condicional. ^[4]^[5]

Estas reglas fueron denominadas " Axiomas grafoides " por Pearl y Paz, ^[6] porque se mantienen en los gráficos, donde ${\ Displaystyle X \ perp \! \! \! \ perp A \ mid B}$ se interpreta en el sentido de: "Todos los caminos de X a A son interceptados por el conjunto B ". ^[7]

Simetría

{\ Displaystyle X \ perp \! \! \! \ perp Y \ quad \ Rightarrow \ quad Y \ perp \! \! \! \ perp X}

Descomposición

{\ Displaystyle X \ perp \! \! \! \ perp A, B \ quad \ Rightarrow \ quad {\ text {y}} {\ begin {cases} X \ perp \! \! \! \ perp A \\ X \ perp \! \! \! \ Perp B \ end {cases}}}

Prueba

${\ Displaystyle p_ {X, A, B} (x, a, b) = p_ {X} (x) p_ {A, B} (a, b)}$ (el significado de ${\ Displaystyle X \ perp \! \! \! \ perp A, B}$ )
${\ Displaystyle \ int _ {B} p_ {X, A, B} (x, a, b) \, db = \ int _ {B} p_ {X} (x) p_ {A, B} (a, b) \, db}$ (ignore la variable B integrándola)
${\ Displaystyle p_ {X, A} (x, a) = p_ {X} (x) p_ {A} (a)}$

Una prueba similares demuestra la independencia de X y B .

Unión débil

{\ Displaystyle X \ perp \! \! \! \ perp A, B \ quad \ Rightarrow \ quad {\ text {y}} {\ begin {cases} X \ perp \! \! \! \ perp A \ mid B \\ X \ perp \! \! \! \ Perp B \ mid A \ end {casos}}}

Prueba

Por definición, ${\ Displaystyle \ Pr (X) = \ Pr (X \ mid A, B)}$ .
Debido a la propiedad de descomposición. ${\ Displaystyle X \ perp \! \! \! \ perp B}$ , ${\ Displaystyle \ Pr (X) = \ Pr (X \ mid B)}$ .
La combinación de las dos igualdad anteriores da ${\ Displaystyle \ Pr (X \ mid B) = \ Pr (X \ mid A, B)}$ , que establece ${\ Displaystyle X \ perp \! \! \! \ perp A \ mid B}$ .

La segunda condición se puede probar de manera similar.

Contracción

{\ Displaystyle \ left. {\ begin {alineado} X \ perp \! \! \! \ perp A \ mid B \\ X \ perp \! \! \! \ perp B \ end {alineado}} \ right \ } {\ text {y}} \ quad \ Rightarrow \ quad X \ perp \! \! \! \ perp A, B}

Prueba

Esta propiedad se puede probar notando ${\ Displaystyle \ Pr (X \ mid A, B) = \ Pr (X \ mid B) = \ Pr (X)}$ , cada igualdad de las cuales es afirmada por ${\ Displaystyle X \ perp \! \! \! \ perp A \ mid B}$ y ${\ Displaystyle X \ perp \! \! \! \ perp B}$ , respectivamente.

Intersección

Para distribuciones de probabilidad estrictamente positivas, ^[5] también se cumple lo siguiente:

{\ Displaystyle \ left. {\ begin {alineado} X \ perp \! \! \! \ perp Y \ mid Z, W \\ X \ perp \! \! \! \ perp W \ mid Z, Y \ end {alineado}} \ right \} {\ text {y}} \ quad \ Rightarrow \ quad X \ perp \! \! \! \ perp W, Y \ mid Z}

Prueba

Por definición:

{\ Displaystyle P (X | Z, W, Y) = P (X | Z, W) \ land P (X | Z, W, Y) = P (X | Z, Y) \ implica P (X | Z , Y) = P (X | Z, W)}

Usando esta igualdad, junto con la Ley de probabilidad total aplicada a ${\ Displaystyle P (X | Z)}$ :

{\ Displaystyle {\ begin {alineado} P (X | Z) & = \ sum _ {w \ in W} P (X | Z, W = w) P (W = w | Z) \\ [4pt] & = \ sum _ {w \ in W} P (X | Y, Z) P (W = w | Z) \\ [4pt] & = P (X | Z, Y) \ sum _ {w \ in W} P (W = w | Z) \\ [4pt] & = P (X | Z, Y) \ end {alineado}}}

Desde ${\ Displaystyle P (X | Z, W, Y) = P (X | Z, Y)}$ y ${\ Displaystyle P (X | Z, Y) = P (X | Z)}$ , resulta que ${\ Displaystyle P (X | Z, W, Y) = P (X | Z) \ iff X \ perp \! \! \! \ perp Y, W | Z}$ .

Nota técnica: ya que estos tienen implicaciones para cualquier espacio de probabilidad, que todavía llevará a cabo si se considera una sub-universo acondicionando todo en otra variable, por ejemplo K . Por ejemplo, ${\ Displaystyle X \ perp \! \! \! \ perp Y \ Rightarrow Y \ perp \! \! \! \ perp X}$ también significaría que ${\ Displaystyle X \ perp \! \! \! \ perp Y \ mid K \ Rightarrow Y \ perp \! \! \! \ perp X \ mid K}$ .

Ver también

Referencias

^ ¿Alguien podría explicar la independencia condicional?
^ Para ver que este es el caso, es necesario darse cuenta de que Pr ( R ∩ B | Y ) es la probabilidad de una superposición de R y B (el área sombreada de color púrpura) en elárea Y. Dado que, en la imagen de la izquierda, hay dos cuadrados donde R y B se superponen dentro delárea Y , y elárea Y tiene doce cuadrados, Pr ( R ∩ B | Y ) =2/12 = 1/6. Del mismo modo, Pr ( R | Y ) = 4/12 = 1/3y Pr ( B | Y ) = 6/12 = 1/2.
^ http://people.cs.ubc.ca/~murphyk/Bayes/bnintro.html
^ Dawid, AP (1979). "Independencia condicional en teoría estadística". Revista de la Sociedad Real de Estadística, Serie B . 41 (1): 1–31. JSTOR 2984718 . Señor 0535541 .
^ ^a ^b J Pearl, Causalidad: modelos, razonamiento e inferencia, 2000, Cambridge University Press
^ Pearl, Judea; Paz, Azaria (1985). "Grafoides: una lógica basada en gráficos para razonar sobre relaciones de relevancia". Falta o vacío |url=( ayuda )
^ Pearl, Judea (1988). Razonamiento probabilístico en sistemas inteligentes: redes de inferencia plausible . Morgan Kaufmann.

enlaces externos

Medios relacionados con la independencia condicional en Wikimedia Commons

[1] ¿Alguien podría explicar la independencia condicional?

[2] Para ver que este es el caso, es necesario darse cuenta de que Pr ( R ∩ B | Y ) es la probabilidad de una superposición de R y B (el área sombreada de color púrpura) en elárea Y. Dado que, en la imagen de la izquierda, hay dos cuadrados donde R y B se superponen dentro delárea Y , y elárea Y tiene doce cuadrados, Pr ( R ∩ B | Y ) =2/12 = 1/6. Del mismo modo, Pr ( R | Y ) = 4/12 = 1/3y Pr ( B | Y ) = 6/12 = 1/2.

[3] ttp://people.cs.ubc.ca/~murphyk/Bayes/bnintro.html

[4] Dawid, AP (1979). "Independencia condicional en teoría estadística". Revista de la Sociedad Real de Estadística, Serie B . 41 (1): 1–31. JSTOR 2984718 . Señor 0535541 .

[pearl:2000-5] J Pearl, Causalidad: modelos, razonamiento e inferencia, 2000, Cambridge University Press

[pearl:paz85-6] Pearl, Judea; Paz, Azaria (1985). "Grafoides: una lógica basada en gráficos para razonar sobre relaciones de relevancia". Falta o vacío |url=( ayuda )

[pearl:88-7] Pearl, Judea (1988). Razonamiento probabilístico en sistemas inteligentes: redes de inferencia plausible . Morgan Kaufmann.

[1]