Independencia (teoría de la probabilidad)

La independencia es una noción fundamental en la teoría de la probabilidad , como en la estadística y la teoría de procesos estocásticos .

Dos eventos son independientes , estadísticamente independientes o estocásticamente independientes ^[1] si la ocurrencia de uno no afecta la probabilidad de ocurrencia del otro (de manera equivalente, no afecta las probabilidades ). De manera similar, dos variables aleatorias son independientes si la realización de una no afecta la distribución de probabilidad de la otra.

Cuando se trata de colecciones de más de dos eventos, es necesario distinguir una noción de independencia débil y una fuerte. Los eventos se denominan independientes por pares si dos eventos de la colección son independientes entre sí, mientras que decir que los eventos son mutuamente independientes (o colectivamente independientes ) significa intuitivamente que cada evento es independiente de cualquier combinación de otros eventos de la colección. Existe una noción similar para las colecciones de variables aleatorias.

El nombre "independencia mutua" (lo mismo que "independencia colectiva") parece el resultado de una elección pedagógica, simplemente para distinguir la noción más fuerte de la "independencia por parejas", que es una noción más débil. En la literatura avanzada de la teoría de la probabilidad, la estadística y los procesos estocásticos, la noción más fuerte se llama simplemente independencia sin modificador. Es más fuerte ya que la independencia implica independencia por pares, pero no al revés.

Definición

Para eventos

Dos eventos

Dos eventos ${\ Displaystyle A}$ y ${\ Displaystyle B}$ son independientes (a menudo escritos como ${\ Displaystyle A \ perp B}$ o ${\ Displaystyle A \ perp \! \! \! \ perp B}$ ) si y solo si su probabilidad conjunta es igual al producto de sus probabilidades: ^[2]^{: p. 29}^[3]^{: pág. 10}

{\ Displaystyle \ mathrm {P} (A \ cap B) = \ mathrm {P} (A) \ mathrm {P} (B)}

( Ecuación 1 )

Por qué esto define la independencia se aclara reescribiendo con probabilidades condicionales :

{\ Displaystyle \ mathrm {P} (A \ cap B) = \ mathrm {P} (A) \ mathrm {P} (B) \ iff \ mathrm {P} (A) = {\ frac {\ mathrm {P } (A \ cap B)} {\ mathrm {P} (B)}} = \ mathrm {P} (A \ mid B).}

y de manera similar

{\ Displaystyle \ mathrm {P} (A \ cap B) = \ mathrm {P} (A) \ mathrm {P} (B) \ iff \ mathrm {P} (B) = \ mathrm {P} (B \ mediados de A).}

Por tanto, la ocurrencia de ${\ Displaystyle B}$ no afecta la probabilidad de ${\ Displaystyle A}$ , y viceversa. Aunque las expresiones derivadas pueden parecer más intuitivas, no son la definición preferida, ya que las probabilidades condicionales pueden no estar definidas si ${\ Displaystyle \ mathrm {P} (A)}$ o ${\ Displaystyle \ mathrm {P} (B)}$ son 0. Además, la definición preferida deja claro por simetría que cuando ${\ Displaystyle A}$ es independiente de ${\ Displaystyle B}$ , ${\ Displaystyle B}$ también es independiente de ${\ Displaystyle A}$ .

Contenido de información y probabilidad de registro

Expresado en términos de probabilidad logarítmica , dos eventos son independientes si y solo si la probabilidad logarítmica del evento conjunto es la suma de la probabilidad logarítmica de los eventos individuales:

{\ Displaystyle \ log \ mathrm {P} (A \ cap B) = \ log \ mathrm {P} (A) + \ log \ mathrm {P} (B)}

En la teoría de la información , la probabilidad logarítmica negativa se interpreta como contenido de información y, por lo tanto, dos eventos son independientes si y solo si el contenido de información del evento combinado es igual a la suma del contenido de información de los eventos individuales:

{\ Displaystyle \ mathrm {I} (A \ cap B) = \ mathrm {I} (A) + \ mathrm {I} (B)}

Consulte Contenido de información § Aditividad de eventos independientes para obtener más detalles.

Impares

Expresado en términos de probabilidades , dos eventos son independientes si y solo si la razón de probabilidades de ${\ Displaystyle A}$ y ${\ Displaystyle B}$ es la unidad (1). De manera análoga a la probabilidad, esto equivale a que las probabilidades condicionales sean iguales a las probabilidades incondicionales:

{\ Displaystyle O (A \ mid B) = O (A) {\ text {y}} O (B \ mid A) = O (B),}

o que las probabilidades de un evento, dado el otro evento, sean las mismas que las probabilidades del evento, dado que el otro evento no ocurre:

{\ displaystyle O (A \ mid B) = O (A \ mid \ neg B) {\ text {y}} O (B \ mid A) = O (B \ mid \ neg A).}

La razón de posibilidades se puede definir como

{\ Displaystyle O (A \ mid B): O (A \ mid \ neg B),}

o simétricamente para las probabilidades de ${\ Displaystyle B}$ dado ${\ Displaystyle A}$ , y por lo tanto es 1 si y solo si los eventos son independientes.

Más de dos eventos

Un conjunto finito de eventos ${\ Displaystyle \ {A_ {i} \} _ {i = 1} ^ {n}}$ es independiente por pares si cada par de eventos es independiente ^[4] , es decir, si y solo si para todos los pares distintos de índices ${\ Displaystyle m, k}$ ,

{\ Displaystyle \ mathrm {P} (A_ {m} \ cap A_ {k}) = \ mathrm {P} (A_ {m}) \ mathrm {P} (A_ {k})}

( Ecuación 2 )

Un conjunto finito de eventos es mutuamente independiente si cada evento es independiente de cualquier intersección de los otros eventos ^[4]^[3]^{: p. 11} , es decir, si y solo si para cada ${\ Displaystyle k \ leq n}$ y por cada ${\ Displaystyle k}$ -subconjunto de elementos de eventos ${\ Displaystyle \ {B_ {i} \} _ {i = 1} ^ {k}}$ de ${\ Displaystyle \ {A_ {i} \} _ {i = 1} ^ {n}}$ ,

{\ Displaystyle \ mathrm {P} \ left (\ bigcap _ {i = 1} ^ {k} B_ {i} \ right) = \ prod _ {i = 1} ^ {k} \ mathrm {P} (B_ {I})}

( Ecuación 3 )

Esto se llama regla de multiplicación para eventos independientes. Tenga en cuenta que no es una condición única que involucra solo el producto de todas las probabilidades de todos los eventos individuales; debe ser cierto para todos los subconjuntos de eventos.

Para más de dos eventos, un conjunto de eventos mutuamente independientes es (por definición) independiente por pares; pero lo contrario no es necesariamente cierto . ^[2]^{: pág. 30}

Para variables aleatorias de valor real

Dos variables aleatorias

Dos variables aleatorias ${\ Displaystyle X}$ y ${\ Displaystyle Y}$ son independientes si y solo si (si) los elementos del sistema π generados por ellos son independientes; es decir, por cada ${\ Displaystyle x}$ y ${\ Displaystyle y}$ , los eventos ${\ Displaystyle \ {X \ leq x \}}$ y ${\ Displaystyle \ {Y \ leq y \}}$ son eventos independientes (como se definieron anteriormente en la ecuación 1 ). Es decir, ${\ Displaystyle X}$ y ${\ Displaystyle Y}$ con funciones de distribución acumulativa ${\ Displaystyle F_ {X} (x)}$ y ${\ Displaystyle F_ {Y} (y)}$ , son independientes si la variable aleatoria combinada ${\ Displaystyle (X, Y)}$ tiene una función de distribución acumulativa conjunta ^[3]^{: p. 15}

{\ Displaystyle F_ {X, Y} (x, y) = F_ {X} (x) F_ {Y} (y) \ quad {\ text {para todos}} x, y}

( Ecuación 4 )

o equivalentemente, si las densidades de probabilidad ${\ Displaystyle f_ {X} (x)}$ y ${\ Displaystyle f_ {Y} (y)}$ y la densidad de probabilidad conjunta ${\ displaystyle f_ {X, Y} (x, y)}$ existe,

{\ Displaystyle f_ {X, Y} (x, y) = f_ {X} (x) f_ {Y} (y) \ quad {\ text {para todos}} x, y.}

Más de dos variables aleatorias

Un conjunto finito de ${\ Displaystyle n}$ variables aleatorias ${\ Displaystyle \ {X_ {1}, \ ldots, X_ {n} \}}$ es independiente por pares si y solo si cada par de variables aleatorias es independiente. Incluso si el conjunto de variables aleatorias es independiente por pares, no es necesariamente independiente entre sí como se define a continuación.

Un conjunto finito de ${\ Displaystyle n}$ variables aleatorias ${\ Displaystyle \ {X_ {1}, \ ldots, X_ {n} \}}$ es mutuamente independiente si y solo si para cualquier secuencia de números ${\ Displaystyle \ {x_ {1}, \ ldots, x_ {n} \}}$ , los eventos ${\ Displaystyle \ {X_ {1} \ leq x_ {1} \}, \ ldots, \ {X_ {n} \ leq x_ {n} \}}$ son eventos mutuamente independientes (como se definieron anteriormente en la ecuación 3 ). Esto es equivalente a la siguiente condición en la función de distribución acumulada conjunta ${\ Displaystyle F_ {X_ {1}, \ ldots, X_ {n}} (x_ {1}, \ ldots, x_ {n})}$ . Un conjunto finito de ${\ Displaystyle n}$ variables aleatorias ${\ Displaystyle \ {X_ {1}, \ ldots, X_ {n} \}}$ es mutuamente independiente si y solo si ^[3]^{: p. dieciséis}

{\ Displaystyle F_ {X_ {1}, \ ldots, X_ {n}} (x_ {1}, \ ldots, x_ {n}) = F_ {X_ {1}} (x_ {1}) \ cdot \ ldots \ cdot F_ {X_ {n}} (x_ {n}) \ quad {\ text {para todos}} x_ {1}, \ ldots, x_ {n}}

( Ecuación 5 )

Nótese que aquí no es necesario exigir que la distribución de probabilidad factorice para todos los posibles ${\ Displaystyle k}$ -subconjuntos de elementos como en el caso de ${\ Displaystyle n}$ eventos. Esto no es necesario porque, por ejemplo, ${\ Displaystyle F_ {X_ {1}, X_ {2}, X_ {3}} (x_ {1}, x_ {2}, x_ {3}) = F_ {X_ {1}} (x_ {1}) \ cdot F_ {X_ {2}} (x_ {2}) \ cdot F_ {X_ {3}} (x_ {3})}$ implica ${\ Displaystyle F_ {X_ {1}, X_ {3}} (x_ {1}, x_ {3}) = F_ {X_ {1}} (x_ {1}) \ cdot F_ {X_ {3}} ( x_ {3})}$ .

Los inclinados a la teoría de la medida pueden preferir sustituir eventos ${\ Displaystyle \ {X \ in A \}}$ para eventos ${\ Displaystyle \ {X \ leq x \}}$ en la definición anterior, donde ${\ Displaystyle A}$ es cualquier conjunto de Borel . Esa definición es exactamente equivalente a la anterior cuando los valores de las variables aleatorias son números reales . Tiene la ventaja de trabajar también para variables aleatorias de valor complejo o para variables aleatorias que toman valores en cualquier espacio medible (que incluye espacios topológicos dotados de σ-álgebras apropiadas).

Para vectores aleatorios de valor real

Dos vectores aleatorios ${\ Displaystyle \ mathbf {X} = (X_ {1}, \ ldots, X_ {m}) ^ {\ mathrm {T}}}$ y ${\ Displaystyle \ mathbf {Y} = (Y_ {1}, \ ldots, Y_ {n}) ^ {\ mathrm {T}}}$ se llaman independientes si ^[5]^{: p. 187}

{\ Displaystyle F _ {\ mathbf {X, Y}} (\ mathbf {x, y}) = F _ {\ mathbf {X}} (\ mathbf {x}) \ cdot F _ {\ mathbf {Y}} (\ mathbf {y}) \ quad {\ text {para todos}} \ mathbf {x}, \ mathbf {y}}

( Ecuación 6 )

dónde ${\ Displaystyle F _ {\ mathbf {X}} (\ mathbf {x})}$ y ${\ Displaystyle F _ {\ mathbf {Y}} (\ mathbf {y})}$ denotar las funciones de distribución acumulativa de ${\ Displaystyle \ mathbf {X}}$ y ${\ Displaystyle \ mathbf {Y}}$ y ${\ Displaystyle F _ {\ mathbf {X, Y}} (\ mathbf {x, y})}$ denota su función de distribución acumulativa conjunta. Independencia de ${\ Displaystyle \ mathbf {X}}$ y ${\ Displaystyle \ mathbf {Y}}$ a menudo se denota por ${\ Displaystyle \ mathbf {X} \ perp \! \! \! \ perp \ mathbf {Y}}$ . Escrito por componentes, ${\ Displaystyle \ mathbf {X}}$ y ${\ Displaystyle \ mathbf {Y}}$ se llaman independientes si

{\ Displaystyle F_ {X_ {1}, \ ldots, X_ {m}, Y_ {1}, \ ldots, Y_ {n}} (x_ {1}, \ ldots, x_ {m}, y_ {1}, \ ldots, y_ {n}) = F_ {X_ {1}, \ ldots, X_ {m}} (x_ {1}, \ ldots, x_ {m}) \ cdot F_ {Y_ {1}, \ ldots, Y_ {n}} (y_ {1}, \ ldots, y_ {n}) \ quad {\ text {para todos}} x_ {1}, \ ldots, x_ {m}, y_ {1}, \ ldots, y_ {n}.}

Para procesos estocásticos

Para un proceso estocástico

La definición de independencia puede extenderse de vectores aleatorios a un proceso estocástico . Por lo tanto, para un proceso estocástico independiente se requiere que las variables aleatorias obtenidas al muestrear el proceso en cualquier ${\ Displaystyle n}$ veces ${\ Displaystyle t_ {1}, \ ldots, t_ {n}}$ son variables aleatorias independientes para cualquier ${\ Displaystyle n}$ . ^[6]^{: pág. 163}

Formalmente, un proceso estocástico ${\ Displaystyle \ left \ {X_ {t} \ right \} _ {t \ in {\ mathcal {T}}}}$ se llama independiente, si y solo si para todos ${\ Displaystyle n \ in \ mathbb {N}}$ y para todos ${\ Displaystyle t_ {1}, \ ldots, t_ {n} \ in {\ mathcal {T}}}$

{\ Displaystyle F_ {X_ {t_ {1}}, \ ldots, X_ {t_ {n}}} (x_ {1}, \ ldots, x_ {n}) = F_ {X_ {t_ {1}}} ( x_ {1}) \ cdot \ ldots \ cdot F_ {X_ {t_ {n}}} (x_ {n}) \ quad {\ text {para todos}} x_ {1}, \ ldots, x_ {n}}

( Ecuación 7 )

dónde ${\ Displaystyle F_ {X_ {t_ {1}}, \ ldots, X_ {t_ {n}}} (x_ {1}, \ ldots, x_ {n}) = \ mathrm {P} (X (t_ {1 }) \ leq x_ {1}, \ ldots, X (t_ {n}) \ leq x_ {n})}$ . La independencia de un proceso estocástico es una propiedad dentro de un proceso estocástico, no entre dos procesos estocásticos.

Para dos procesos estocásticos

La independencia de dos procesos estocásticos es una propiedad entre dos procesos estocásticos ${\ Displaystyle \ left \ {X_ {t} \ right \} _ {t \ in {\ mathcal {T}}}}$ y ${\ Displaystyle \ left \ {Y_ {t} \ right \} _ {t \ in {\ mathcal {T}}}}$ que se definen en el mismo espacio de probabilidad ${\ Displaystyle (\ Omega, {\ mathcal {F}}, P)}$ . Formalmente, dos procesos estocásticos ${\ Displaystyle \ left \ {X_ {t} \ right \} _ {t \ in {\ mathcal {T}}}}$ y ${\ Displaystyle \ left \ {Y_ {t} \ right \} _ {t \ in {\ mathcal {T}}}}$ se dice que son independientes si para todos ${\ Displaystyle n \ in \ mathbb {N}}$ y para todos ${\ Displaystyle t_ {1}, \ ldots, t_ {n} \ in {\ mathcal {T}}}$ , los vectores aleatorios ${\ Displaystyle (X (t_ {1}), \ ldots, X (t_ {n}))}$ y ${\ Displaystyle (Y (t_ {1}), \ ldots, Y (t_ {n}))}$ son independientes, ^[7]^{: pág. 515} es decir, si

{\ Displaystyle F_ {X_ {t_ {1}}, \ ldots, X_ {t_ {n}}, Y_ {t_ {1}}, \ ldots, Y_ {t_ {n}}} (x_ {1}, \ ldots, x_ {n}, y_ {1}, \ ldots, y_ {n}) = F_ {X_ {t_ {1}}, \ ldots, X_ {t_ {n}}} (x_ {1}, \ ldots , x_ {n}) \ cdot F_ {Y_ {t_ {1}}, \ ldots, Y_ {t_ {n}}} (y_ {1}, \ ldots, y_ {n}) \ quad {\ text {para todos}} x_ {1}, \ ldots, x_ {n}}

( Ecuación 8 )

Σ-álgebras independientes

Las definiciones anteriores ( ecuación 1 y ecuación 2 ) están generalizadas por la siguiente definición de independencia para σ-álgebras . Dejar ${\ Displaystyle (\ Omega, \ Sigma, \ mathrm {P})}$ ser un espacio de probabilidad y dejar ${\ Displaystyle {\ mathcal {A}}}$ y ${\ Displaystyle {\ mathcal {B}}}$ ser dos sub-σ-álgebras de ${\ Displaystyle \ Sigma}$ . ${\ Displaystyle {\ mathcal {A}}}$ y ${\ Displaystyle {\ mathcal {B}}}$ se dice que son independientes si, siempre que ${\ Displaystyle A \ in {\ mathcal {A}}}$ y ${\ Displaystyle B \ in {\ mathcal {B}}}$ ,

{\ Displaystyle \ mathrm {P} (A \ cap B) = \ mathrm {P} (A) \ mathrm {P} (B).}

Asimismo, una familia finita de σ-álgebras ${\ Displaystyle (\ tau _ {i}) _ {i \ in I}}$ , dónde ${\ Displaystyle I}$ es un conjunto de índices , se dice que es independiente si y solo si

{\ Displaystyle \ forall \ left (A_ {i} \ right) _ {i \ in I} \ in \ prod \ nolimits _ {i \ in I} \ tau _ {i} \: \ \ mathrm {P} \ left (\ bigcap \ nolimits _ {i \ in I} A_ {i} \ right) = \ prod \ nolimits _ {i \ in I} \ mathrm {P} \ left (A_ {i} \ right)}

y se dice que una familia infinita de σ-álgebras es independiente si todas sus subfamilias finitas son independientes.

La nueva definición se relaciona con las anteriores de manera muy directa:

Dos eventos son independientes (en el sentido antiguo) si y solo si las σ-álgebras que generan son independientes (en el nuevo sentido). La σ-álgebra generada por un evento ${\ Displaystyle E \ in \ Sigma}$ es, por definición,

{\ Displaystyle \ sigma (\ {E \}) = \ {\ emptyset, E, \ Omega \ setminus E, \ Omega \}.}

Dos variables aleatorias ${\ Displaystyle X}$ y ${\ Displaystyle Y}$ definido sobre ${\ Displaystyle \ Omega}$ son independientes (en el sentido antiguo) si y solo si las σ-álgebras que generan son independientes (en el nuevo sentido). La σ-álgebra generada por una variable aleatoria ${\ Displaystyle X}$ tomando valores en algún espacio medible ${\ Displaystyle S}$ consiste, por definición, en todos los subconjuntos de ${\ Displaystyle \ Omega}$ de la forma ${\ Displaystyle X ^ {- 1} (U)}$ , dónde ${\ Displaystyle U}$ es cualquier subconjunto medible de ${\ Displaystyle S}$ .

Usando esta definición, es fácil demostrar que si ${\ Displaystyle X}$ y ${\ Displaystyle Y}$ son variables aleatorias y ${\ Displaystyle Y}$ es constante, entonces ${\ Displaystyle X}$ y ${\ Displaystyle Y}$ son independientes, ya que la σ-álgebra generada por una variable aleatoria constante es la σ-álgebra trivial ${\ Displaystyle \ {\ varnothing, \ Omega \}}$ . Los eventos de probabilidad cero no pueden afectar la independencia, por lo que la independencia también es válida si ${\ Displaystyle Y}$ es sólo Pr- casi con seguridad constante.

Propiedades

Autoindependencia

Tenga en cuenta que un evento es independiente de sí mismo si y solo si

{\ Displaystyle \ mathrm {P} (A) = \ mathrm {P} (A \ cap A) = \ mathrm {P} (A) \ cdot \ mathrm {P} (A) \ iff \ mathrm {P} ( A) = 0 {\ text {o}} \ mathrm {P} (A) = 1.}

Así, un evento es independiente de sí mismo si y sólo si ocurre casi con seguridad o su complemento ocurre casi con certeza; este hecho es útil para probar leyes cero-uno . ^[8]

Expectativa y covarianza

Si ${\ Displaystyle X}$ y ${\ Displaystyle Y}$ son variables aleatorias independientes, entonces el operador de expectativa ${\ Displaystyle \ operatorname {E}}$ tiene la propiedad

{\ Displaystyle \ operatorname {E} [XY] = \ operatorname {E} [X] \ operatorname {E} [Y],}

y la covarianza ${\ Displaystyle \ operatorname {cov} [X, Y]}$ es cero, como sigue de

{\ Displaystyle \ operatorname {cov} [X, Y] = \ operatorname {E} [XY] - \ operatorname {E} [X] \ operatorname {E} [Y].}

Lo contrario no se cumple: si dos variables aleatorias tienen una covarianza de 0, es posible que aún no sean independientes. Ver no correlacionado .

De manera similar para dos procesos estocásticos ${\ Displaystyle \ left \ {X_ {t} \ right \} _ {t \ in {\ mathcal {T}}}}$ y ${\ Displaystyle \ left \ {Y_ {t} \ right \} _ {t \ in {\ mathcal {T}}}}$ : Si son independientes, entonces no están correlacionados. ^[9]^{: pág. 151}

Función característica

Dos variables aleatorias ${\ Displaystyle X}$ y ${\ Displaystyle Y}$ son independientes si y solo si la función característica del vector aleatorio ${\ Displaystyle (X, Y)}$ satisface

{\ Displaystyle \ varphi _ {(X, Y)} (t, s) = \ varphi _ {X} (t) \ cdot \ varphi _ {Y} (s).}

En particular, la función característica de su suma es el producto de sus funciones características marginales:

{\ Displaystyle \ varphi _ {X + Y} (t) = \ varphi _ {X} (t) \ cdot \ varphi _ {Y} (t),}

aunque la implicación inversa no es cierta. Las variables aleatorias que satisfacen esta última condición se denominan subindependientes .

Ejemplos de

Dados rodantes

El evento de obtener un 6 la primera vez que se lanza un dado y el evento de obtener un 6 la segunda vez son independientes . Por el contrario, el evento de obtener un 6 la primera vez que se lanza un dado y el evento de que la suma de los números vistos en la primera y segunda prueba sea 8 no son independientes.

Tarjetas de dibujo

Si se sacan dos cartas con reemplazo de una baraja de cartas, el evento de sacar una tarjeta roja en el primer intento y el de sacar una tarjeta roja en el segundo intento son independientes . Por el contrario, si se extraen dos cartas sin reemplazo de una baraja de cartas, el evento de sacar una carta roja en el primer intento y el de sacar una roja en el segundo intento no son independientes, porque una baraja que ha tenido una roja la tarjeta extraída tiene proporcionalmente menos tarjetas rojas.

Independencia mutua y por parejas

Eventos independientes por pares, pero no mutuamente independientes.

Eventos mutuamente independientes.

Considere los dos espacios de probabilidad que se muestran. En ambos casos, ${\ Displaystyle \ mathrm {P} (A) = \ mathrm {P} (B) = 1/2}$ y ${\ Displaystyle \ mathrm {P} (C) = 1/4}$ . Las variables aleatorias en el primer espacio son independientes por pares porque ${\ Displaystyle \ mathrm {P} (A | B) = \ mathrm {P} (A | C) = 1/2 = \ mathrm {P} (A)}$ , ${\ Displaystyle \ mathrm {P} (B | A) = \ mathrm {P} (B | C) = 1/2 = \ mathrm {P} (B)}$ , y ${\ Displaystyle \ mathrm {P} (C | A) = \ mathrm {P} (C | B) = 1/4 = \ mathrm {P} (C)}$ ; pero las tres variables aleatorias no son mutuamente independientes. Las variables aleatorias en el segundo espacio son independientes por pares y mutuamente independientes. Para ilustrar la diferencia, considere el condicionamiento en dos eventos. En el caso independiente por pares, aunque cualquier evento es independiente de cada uno de los otros dos individualmente, no es independiente de la intersección de los otros dos:

{\ Displaystyle \ mathrm {P} (A | BC) = {\ frac {\ frac {4} {40}} {{\ frac {4} {40}} + {\ frac {1} {40}}} } = {\ tfrac {4} {5}} \ neq \ mathrm {P} (A)}

{\ Displaystyle \ mathrm {P} (B | AC) = {\ frac {\ frac {4} {40}} {{\ frac {4} {40}} + {\ frac {1} {40}}} } = {\ tfrac {4} {5}} \ neq \ mathrm {P} (B)}

{\ Displaystyle \ mathrm {P} (C | AB) = {\ frac {\ frac {4} {40}} {{\ frac {4} {40}} + {\ frac {6} {40}}} } = {\ tfrac {2} {5}} \ neq \ mathrm {P} (C)}

En el caso mutuamente independiente, sin embargo,

{\ Displaystyle \ mathrm {P} (A | BC) = {\ frac {\ frac {1} {16}} {{\ frac {1} {16}} + {\ frac {1} {16}}} } = {\ tfrac {1} {2}} = \ mathrm {P} (A)}

{\ Displaystyle \ mathrm {P} (B | AC) = {\ frac {\ frac {1} {16}} {{\ frac {1} {16}} + {\ frac {1} {16}}} } = {\ tfrac {1} {2}} = \ mathrm {P} (B)}

{\ Displaystyle \ mathrm {P} (C | AB) = {\ frac {\ frac {1} {16}} {{\ frac {1} {16}} + {\ frac {3} {16}}} } = {\ tfrac {1} {4}} = \ mathrm {P} (C)}

Independencia mutua

Es posible crear un ejemplo de tres eventos en el que

{\ Displaystyle \ mathrm {P} (A \ cap B \ cap C) = \ mathrm {P} (A) \ mathrm {P} (B) \ mathrm {P} (C),}

y, sin embargo, no hay dos de los tres eventos independientes por pares (y por lo tanto el conjunto de eventos no son mutuamente independientes). ^[10] Este ejemplo muestra que la independencia mutua implica requisitos sobre los productos de las probabilidades de todas las combinaciones de eventos, no solo los eventos individuales como en este ejemplo.

Independencia condicional

Para eventos

Los eventos ${\ Displaystyle A}$ y ${\ Displaystyle B}$ son condicionalmente independientes dado un evento ${\ Displaystyle C}$ Cuándo

${\ Displaystyle \ mathrm {P} (A \ cap B \ mid C) = \ mathrm {P} (A \ mid C) \ cdot \ mathrm {P} (B \ mid C)}$ .

Para variables aleatorias

Intuitivamente, dos variables aleatorias ${\ Displaystyle X}$ y ${\ Displaystyle Y}$ son condicionalmente independientes dado ${\ Displaystyle Z}$ si, una vez ${\ Displaystyle Z}$ es conocido, el valor de ${\ Displaystyle Y}$ no agrega ninguna información adicional sobre ${\ Displaystyle X}$ . Por ejemplo, dos medidas ${\ Displaystyle X}$ y ${\ Displaystyle Y}$ de la misma cantidad subyacente ${\ Displaystyle Z}$ no son independientes, pero son condicionalmente independientes dado ${\ Displaystyle Z}$ (a menos que los errores en las dos mediciones estén conectados de alguna manera).

La definición formal de independencia condicional se basa en la idea de distribuciones condicionales . Si ${\ Displaystyle X}$ , ${\ Displaystyle Y}$ , y ${\ Displaystyle Z}$ son variables aleatorias discretas , entonces definimos ${\ Displaystyle X}$ y ${\ Displaystyle Y}$ ser condicionalmente independiente dado ${\ Displaystyle Z}$ Si

{\ Displaystyle \ mathrm {P} (X \ leq x, Y \ leq y \; | \; Z = z) = \ mathrm {P} (X \ leq x \; | \; Z = z) \ cdot \ mathrm {P} (Y \ leq y \; | \; Z = z)}

para todos ${\ Displaystyle x}$ , ${\ Displaystyle y}$ y ${\ Displaystyle z}$ tal que ${\ Displaystyle \ mathrm {P} (Z = z)> 0}$ . Por otro lado, si las variables aleatorias son continuas y tienen una función de densidad de probabilidad conjunta ${\ Displaystyle f_ {XYZ} (x, y, z)}$ , luego ${\ Displaystyle X}$ y ${\ Displaystyle Y}$ son condicionalmente independientes dado ${\ Displaystyle Z}$ Si

{\ Displaystyle f_ {XY | Z} (x, y | z) = f_ {X | Z} (x | z) \ cdot f_ {Y | Z} (y | z)}

para todos los números reales ${\ Displaystyle x}$ , ${\ Displaystyle y}$ y ${\ Displaystyle z}$ tal que ${\ Displaystyle f_ {Z} (z)> 0}$ .

Si discreto ${\ Displaystyle X}$ y ${\ Displaystyle Y}$ son condicionalmente independientes dado ${\ Displaystyle Z}$ , luego

{\ Displaystyle \ mathrm {P} (X = x | Y = y, Z = z) = \ mathrm {P} (X = x | Z = z)}

para cualquier ${\ Displaystyle x}$ , ${\ Displaystyle y}$ y ${\ Displaystyle z}$ con ${\ Displaystyle \ mathrm {P} (Z = z)> 0}$ . Es decir, la distribución condicional para ${\ Displaystyle X}$ dado ${\ Displaystyle Y}$ y ${\ Displaystyle Z}$ es el mismo que el dado ${\ Displaystyle Z}$ solo. Una ecuación similar es válida para las funciones de densidad de probabilidad condicional en el caso continuo.

La independencia puede verse como un tipo especial de independencia condicional, ya que la probabilidad puede verse como un tipo de probabilidad condicional dado que no hay eventos.

Ver también

Cópula (estadísticas)
Variables aleatorias independientes e idénticamente distribuidas
Eventos mutuamente excluyentes
Eventos independientes por pares
Subindependencia
Independencia condicional
Normalmente distribuido y no correlacionado no implica independiente
Dependencia media

Referencias

^ Russell, Stuart; Norvig, Peter (2002). Inteligencia artificial: un enfoque moderno . Prentice Hall . pag. 478 . ISBN 0-13-790395-2.
^ a b Florescu, Ionut (2014). Probabilidad y procesos estocásticos . Wiley. ISBN 978-0-470-62455-5.
^ a b c d Gallager, Robert G. (2013). Teoría de procesos estocásticos para aplicaciones . Prensa de la Universidad de Cambridge. ISBN 978-1-107-03975-9.
^ a b Feller, W. (1971). "Independencia estocástica". Introducción a la teoría de la probabilidad y sus aplicaciones . Wiley .
^ Papoulis, Athanasios (1991). Probabilidad, variables aleatorias y procesos estocásticos . MCGraw Hill. ISBN 0-07-048477-5.
^ Hwei, Piao (1997). Teoría y problemas de probabilidad, variables aleatorias y procesos aleatorios . McGraw-Hill. ISBN 0-07-030644-3.
^ Amos Lapidoth (8 de febrero de 2017). Una base en la comunicación digital . Prensa de la Universidad de Cambridge. ISBN 978-1-107-17732-1.
^ Durrett, Richard (1996). Probabilidad: teoría y ejemplos (Segunda ed.). página 62
^ Park, Kun Il (2018). Fundamentos de Probabilidad y Procesos Estocásticos con Aplicaciones a las Comunicaciones . Saltador. ISBN 978-3-319-68074-3.
^ George, Glyn, "Prueba de la independencia de tres eventos", Mathematical Gazette 88, noviembre de 2004, 568. PDF

enlaces externos

Medios relacionados con la dependencia estadística en Wikimedia Commons

[Artificial_Intelligence-1] Russell, Stuart; Norvig, Peter (2002). Inteligencia artificial: un enfoque moderno . Prentice Hall . pag. 478 . ISBN 0-13-790395-2.

[Florescu-2] Florescu, Ionut (2014). Probabilidad y procesos estocásticos . Wiley. ISBN 978-0-470-62455-5.

[Gallager-3] Gallager, Robert G. (2013). Teoría de procesos estocásticos para aplicaciones . Prensa de la Universidad de Cambridge. ISBN 978-1-107-03975-9.

[Feller-4] Feller, W. (1971). "Independencia estocástica". Introducción a la teoría de la probabilidad y sus aplicaciones . Wiley .

[Papoulis-5] Papoulis, Athanasios (1991). Probabilidad, variables aleatorias y procesos estocásticos . MCGraw Hill. ISBN 0-07-048477-5.

[HweiHsu-6] Hwei, Piao (1997). Teoría y problemas de probabilidad, variables aleatorias y procesos aleatorios . McGraw-Hill. ISBN 0-07-030644-3.

[Lapidoth2017-7] Amos Lapidoth (8 de febrero de 2017). Una base en la comunicación digital . Prensa de la Universidad de Cambridge. ISBN 978-1-107-17732-1.

[8] Durrett, Richard (1996). Probabilidad: teoría y ejemplos (Segunda ed.). página 62

[KunIlPark-9] Park, Kun Il (2018). Fundamentos de Probabilidad y Procesos Estocásticos con Aplicaciones a las Comunicaciones . Saltador. ISBN 978-3-319-68074-3.

[10] George, Glyn, "Prueba de la independencia de tres eventos", Mathematical Gazette 88, noviembre de 2004, 568. PDF

[1]