Covarianza

En teoría de probabilidad y estadística , la covarianza es una medida de la variabilidad conjunta de dos variables aleatorias . ^[1] Si los valores mayores de una variable se corresponden principalmente con los valores mayores de la otra variable, y lo mismo ocurre con los valores menores (es decir, las variables tienden a mostrar un comportamiento similar), la covarianza es positiva. ^[2] En el caso contrario, cuando los valores mayores de una variable corresponden principalmente a los valores menores de la otra (es decir, las variables tienden a mostrar un comportamiento opuesto), la covarianza es negativa. Por tanto, el signo de la covarianza muestra la tendencia en la relación linealentre las variables. La magnitud de la covarianza no es fácil de interpretar porque no está normalizada y, por tanto, depende de las magnitudes de las variables. La versión normalizada de la covarianza , el coeficiente de correlación , sin embargo, muestra por su magnitud la fuerza de la relación lineal.

El signo de la covarianza de dos variables aleatorias X e Y

Se debe hacer una distinción entre (1) la covarianza de dos variables aleatorias, que es un parámetro poblacional que puede verse como una propiedad de la distribución de probabilidad conjunta , y (2) la covarianza muestral , que además de servir como descriptor de la muestra, también sirve como valor estimado del parámetro de población.

Definición

Durante dos conjuntamente distribuido verdadera -valued variables aleatorias ${\ Displaystyle X}$ y ${\ Displaystyle Y}$ con segundos momentos finitos , la covarianza se define como el valor esperado (o media) del producto de sus desviaciones de sus valores esperados individuales: ^[3]^[4]^{: p. 119}

{\ Displaystyle \ operatorname {cov} (X, Y) = \ operatorname {E} {{\ big [} (X- \ operatorname {E} [X]) (Y- \ operatorname {E} [Y]) { \grande ]}}}

( Ecuación 1 )

dónde ${\ Displaystyle \ operatorname {E} [X]}$ es el valor esperado de ${\ Displaystyle X}$ , también conocido como la media de ${\ Displaystyle X}$ . La covarianza también se denota a veces ${\ Displaystyle \ sigma _ {XY}}$ o ${\ Displaystyle \ sigma (X, Y)}$ , en analogía con la varianza . Al usar la propiedad de linealidad de las expectativas, esto se puede simplificar al valor esperado de su producto menos el producto de sus valores esperados:

{\ displaystyle {\ begin {alineado} \ operatorname {cov} (X, Y) & = \ operatorname {E} \ left [\ left (X- \ operatorname {E} \ left [X \ right] \ right) \ left (Y- \ operatorname {E} \ left [Y \ right] \ right) \ right] \\ & = \ operatorname {E} \ left [XY-X \ operatorname {E} \ left [Y \ right] - \ operatorname {E} \ left [X \ right] Y + \ operatorname {E} \ left [X \ right] \ operatorname {E} \ left [Y \ right] \ right] \\ & = \ operatorname {E} \ left [XY \ right] - \ operatorname {E} \ left [X \ right] \ operatorname {E} \ left [Y \ right] - \ operatorname {E} \ left [X \ right] \ operatorname {E} \ left [Y \ right] + \ operatorname {E} \ left [X \ right] \ operatorname {E} \ left [Y \ right] \\ & = \ operatorname {E} \ left [XY \ right] - \ operatorname {E} \ left [X \ right] \ operatorname {E} \ left [Y \ right], \ end {alineado}}}

pero esta ecuación es susceptible de cancelación catastrófica (consulte la sección sobre cálculo numérico a continuación).

Las unidades de medida de la covarianza. ${\ Displaystyle \ operatorname {cov} (X, Y)}$ son los de ${\ Displaystyle X}$ veces los de ${\ Displaystyle Y}$ . Por el contrario, los coeficientes de correlación , que dependen de la covarianza, son una medida adimensional de dependencia lineal. (De hecho, los coeficientes de correlación pueden entenderse simplemente como una versión normalizada de la covarianza).

Definición de variables aleatorias complejas

La covarianza entre dos variables aleatorias complejas ${\ Displaystyle Z, W}$ se define como ^[4]^{: p. 119}

{\ Displaystyle \ operatorname {cov} (Z, W) = \ operatorname {E} \ left [(Z- \ operatorname {E} [Z]) {\ overline {(W- \ operatorname {E} [W]) }} \ right] = \ operatorname {E} \ left [Z {\ overline {W}} \ right] - \ operatorname {E} [Z] \ operatorname {E} \ left [{\ overline {W}} \ derecho]}

Observe la compleja conjugación del segundo factor en la definición.

Variables aleatorias discretas

Si el par de variables aleatorias (reales) ${\ Displaystyle (X, Y)}$ puede asumir los valores ${\ Displaystyle (x_ {i}, y_ {i})}$ por ${\ Displaystyle i = 1, \ ldots, n}$ , con iguales probabilidades ${\ Displaystyle p_ {i} = 1 / n}$ , entonces la covarianza se puede escribir de manera equivalente en términos de las medias ${\ Displaystyle \ operatorname {E} [X]}$ y ${\ Displaystyle \ operatorname {E} [Y]}$ como

{\ Displaystyle \ operatorname {cov} (X, Y) = {\ frac {1} {n}} \ sum _ {i = 1} ^ {n} (x_ {i} -E (X)) (y_ { i} -E (Y)).}

También se puede expresar de manera equivalente, sin hacer referencia directa a los medios, como ^[5]

{\ Displaystyle \ operatorname {cov} (X, Y) = {\ frac {1} {n ^ {2}}} \ sum _ {i = 1} ^ {n} \ sum _ {j = 1} ^ { n} {\ frac {1} {2}} (x_ {i} -x_ {j}) (y_ {i} -y_ {j}) = {\ frac {1} {n ^ {2}}} \ suma _ {i} \ suma _ {j> i} (x_ {i} -x_ {j}) (y_ {i} -y_ {j}).}

De manera más general, si hay ${\ Displaystyle n}$ posibles realizaciones de ${\ Displaystyle (X, Y)}$ , a saber ${\ Displaystyle (x_ {i}, y_ {i})}$ pero con probabilidades posiblemente desiguales ${\ Displaystyle p_ {i}}$ por ${\ Displaystyle i = 1, \ ldots, n}$ , entonces la covarianza es

{\ Displaystyle \ operatorname {cov} (X, Y) = \ sum _ {i = 1} ^ {n} p_ {i} (x_ {i} -E (X)) (y_ {i} -E (Y )).}

Ejemplo

Interpretación geométrica del ejemplo de covarianza. Cada cuboide es el cuadro delimitador de su punto ( x , y , f ( x , y )) y las medias X e Y (punto magenta). La covarianza es la suma de los volúmenes de los cuboides rojos menos los cuboides azules.

Suponer que ${\ Displaystyle X}$ y ${\ Displaystyle Y}$ tienen la siguiente función de masa de probabilidad conjunta , ^[6] en la que las seis celdas centrales dan las probabilidades conjuntas discretas ${\ Displaystyle f (x, y)}$ de las seis realizaciones hipotéticas ${\ displaystyle (x, y) \ in S = \ left \ {(5,8), (6,8), (7,8), (5,9), (6,9), (7,9 )\derecho\}}$ :

${\ Displaystyle f (x, y)}$		5	6	7	${\ Displaystyle f_ {Y} (y)}$
${\ Displaystyle f (x, y)}$		X			${\ Displaystyle f_ {Y} (y)}$
y	8	0	0.4	0,1	0,5
y	9	0,3	0	0,2	0,5

${\ Displaystyle f_ {X} (x)}$		0,3	0.4	0,3	1

${\ Displaystyle X}$ puede tomar tres valores (5, 6 y 7) mientras que ${\ Displaystyle Y}$ puede asumir dos (8 y 9). Sus medios son ${\ Displaystyle \ mu _ {X} = 5 (0.3) +6 (0.4) +7 (0.1 + 0.2) = 6}$ y ${\ Displaystyle \ mu _ {Y} = 8 (0.4 + 0.1) +9 (0.3 + 0.2) = 8.5}$ . Luego,

{\ Displaystyle {\ begin {alineado} \ operatorname {cov} (X, Y) = {} & \ sigma _ {XY} = \ sum _ {(x, y) \ in S} f (x, y) \ izquierda (x- \ mu _ {X} \ derecha) \ izquierda (y- \ mu _ {Y} \ derecha) \\ [4pt] = {} & (0) (5-6) (8-8.5) + (0.4) (6-6) (8-8.5) + (0.1) (7-6) (8-8.5) + {} \\ [4pt] y (0.3) (5-6) (9-8.5) + (0) (6-6) (9-8.5) + (0.2) (7-6) (9-8.5) \\ [4pt] = {} & {- 0.1} \;. \ End {alineado}}}

Propiedades

Covarianza consigo mismo

La varianza es un caso especial de covarianza en el que las dos variables son idénticas (es decir, en el que una variable siempre toma el mismo valor que la otra): ^[4]^{: p. 121}

{\ Displaystyle \ operatorname {cov} (X, X) = \ operatorname {var} (X) \ equiv \ sigma ^ {2} (X) \ equiv \ sigma _ {X} ^ {2}.}

Covarianza de combinaciones lineales

Si ${\ Displaystyle X}$ , ${\ Displaystyle Y}$ , ${\ Displaystyle W}$ , y ${\ Displaystyle V}$ son variables aleatorias de valor real y ${\ Displaystyle a, b, c, d}$ son constantes de valor real, entonces los siguientes hechos son una consecuencia de la definición de covarianza:

{\ displaystyle {\ begin {alineado} \ operatorname {cov} (X, a) & = 0 \\\ operatorname {cov} (X, X) & = \ operatorname {var} (X) \\\ operatorname {cov } (X, Y) & = \ operatorname {cov} (Y, X) \\\ operatorname {cov} (aX, bY) & = ab \, \ operatorname {cov} (X, Y) \\\ operatorname { cov} (X + a, Y + b) & = \ operatorname {cov} (X, Y) \\\ operatorname {cov} (aX + bY, cW + dV) & = ac \, \ operatorname {cov} ( X, W) + ad \, \ operatorname {cov} (X, V) + bc \, \ operatorname {cov} (Y, W) + bd \, \ operatorname {cov} (Y, V) \ end {alineado }}}

Para una secuencia ${\ Displaystyle X_ {1}, \ ldots, X_ {n}}$ de variables aleatorias en valores reales y constantes ${\ Displaystyle a_ {1}, \ ldots, a_ {n}}$ , tenemos

{\ Displaystyle \ operatorname {var} \ left (\ sum _ {i = 1} ^ {n} a_ {i} X_ {i} \ right) = \ sum _ {i = 1} ^ {n} a_ {i } ^ {2} \ sigma ^ {2} (X_ {i}) + 2 \ sum _ {i, j \,: \, i }>

Identidad de covarianza de Hoeffding

Una identidad útil para calcular la covarianza entre dos variables aleatorias ${\ Displaystyle X, Y}$ es la identidad de covarianza de Hoeffding: ^[7]

{\ Displaystyle \ operatorname {cov} (X, Y) = \ int _ {\ mathbb {R}} \ int _ {\ mathbb {R}} \ left (F _ {(X, Y)} (x, y) -F_ {X} (x) F_ {Y} (y) \ derecha) \, dx \, dy}

dónde ${\ Displaystyle F _ {(X, Y)} (x, y)}$ es la función de distribución acumulativa conjunta del vector aleatorio ${\ Displaystyle (X, Y)}$ y ${\ Displaystyle F_ {X} (x), F_ {Y} (y)}$ son los marginales .

Falta de correlación e independencia

Las variables aleatorias cuya covarianza es cero se denominan no correlacionadas . ^[4]^{: pág. 121} De manera similar, los componentes de vectores aleatorios cuya matriz de covarianza es cero en cada entrada fuera de la diagonal principal también se denominan no correlacionados.

Si ${\ Displaystyle X}$ y ${\ Displaystyle Y}$ son variables aleatorias independientes , entonces su covarianza es cero. ^[4]^{: pág. 123}^[8] Esto se sigue porque bajo la independencia,

{\ Displaystyle \ operatorname {E} [XY] = \ operatorname {E} [X] \ cdot \ operatorname {E} [Y].}

Sin embargo, lo contrario no es generalmente cierto. Por ejemplo, deja ${\ Displaystyle X}$ distribuirse uniformemente en ${\ displaystyle [-1,1]}$ y deja ${\ Displaystyle Y = X ^ {2}}$ . Claramente, ${\ Displaystyle X}$ y ${\ Displaystyle Y}$ no son independientes, pero

{\ displaystyle {\ begin {alineado} \ operatorname {cov} (X, Y) & = \ operatorname {cov} \ left (X, X ^ {2} \ right) \\ & = \ operatorname {E} \ left [X \ cdot X ^ {2} \ right] - \ operatorname {E} [X] \ cdot \ operatorname {E} \ left [X ^ {2} \ right] \\ & = \ operatorname {E} \ left [X ^ {3} \ right] - \ operatorname {E} [X] \ operatorname {E} \ left [X ^ {2} \ right] \\ & = 0-0 \ cdot \ operatorname {E} [X ^ {2}] \\ & = 0. \ end {alineado}}}

En este caso, la relación entre ${\ Displaystyle Y}$ y ${\ Displaystyle X}$ no es lineal, mientras que la correlación y la covarianza son medidas de dependencia lineal entre dos variables aleatorias. Este ejemplo muestra que si dos variables aleatorias no están correlacionadas, eso no implica en general que sean independientes. Sin embargo, si dos variables están en forma conjunta distribuyen normalmente (pero no si son meramente individual distribuidos normalmente ), uncorrelatedness hace implicaría la independencia.

Relación con los productos internos

Muchas de las propiedades de la covarianza se pueden extraer elegantemente al observar que satisface propiedades similares a las de un producto interno :

bilineal : para constantes ${\ Displaystyle a}$ y ${\ Displaystyle b}$ y variables aleatorias ${\ Displaystyle X, Y, Z}$ , ${\ Displaystyle \ operatorname {cov} (aX + bY, Z) = a \ operatorname {cov} (X, Z) + b \ operatorname {cov} (Y, Z)}$
simétrico: ${\ Displaystyle \ operatorname {cov} (X, Y) = \ operatorname {cov} (Y, X)}$
semidefinido positivo : ${\ Displaystyle \ sigma ^ {2} (X) = \ operatorname {cov} (X, X) \ geq 0}$ para todas las variables aleatorias ${\ Displaystyle X}$ , y ${\ Displaystyle \ operatorname {cov} (X, X) = 0}$ implica que ${\ Displaystyle X}$ es constante casi con seguridad .

De hecho, estas propiedades implican que la covarianza define un producto interno sobre el espacio vectorial cociente obtenido tomando el subespacio de variables aleatorias con segundo momento finito e identificando dos cualesquiera que difieran por una constante. (Esta identificación convierte la semidefinición positiva anterior en definición positiva.) Ese espacio vectorial cociente es isomorfo al subespacio de variables aleatorias con segundo momento finito y media cero; en ese subespacio, la covarianza es exactamente el producto interno L ² de funciones de valor real en el espacio muestral.

Como resultado, para las variables aleatorias con varianza finita, la desigualdad

{\ Displaystyle | \ operatorname {cov} (X, Y) | \ leq {\ sqrt {\ sigma ^ {2} (X) \ sigma ^ {2} (Y)}}}

se mantiene a través de la desigualdad de Cauchy-Schwarz .

Prueba: si ${\ Displaystyle \ sigma ^ {2} (Y) = 0}$ , luego se sostiene trivialmente. De lo contrario, deje que la variable aleatoria

{\ Displaystyle Z = X - {\ frac {\ operatorname {cov} (X, Y)} {\ sigma ^ {2} (Y)}} Y.}

Entonces nosotros tenemos

{\ displaystyle {\ begin {align} 0 \ leq \ sigma ^ {2} (Z) & = \ operatorname {cov} \ left (X - {\ frac {\ operatorname {cov} (X, Y)} {\ sigma ^ {2} (Y)}} Y, \; X - {\ frac {\ operatorname {cov} (X, Y)} {\ sigma ^ {2} (Y)}} Y \ right) \\ [ 12pt] & = \ sigma ^ {2} (X) - {\ frac {(\ operatorname {cov} (X, Y)) ^ {2}} {\ sigma ^ {2} (Y)}}. \ End {alineado}}}

Calcular la covarianza de la muestra

Las covarianzas muestrales entre ${\ Displaystyle K}$ variables basadas en ${\ Displaystyle N}$ Las observaciones de cada uno, extraídas de una población no observada de otro modo, están dadas por ${\ Displaystyle K \ times K}$ matriz ${\ Displaystyle \ textstyle {\ overline {\ mathbf {q}}} = \ left [q_ {jk} \ right]}$ con las entradas

{\ Displaystyle q_ {jk} = {\ frac {1} {N-1}} \ sum _ {i = 1} ^ {N} \ left (X_ {ij} - {\ bar {X}} _ {j } \ right) \ left (X_ {ik} - {\ bar {X}} _ {k} \ right),}

que es una estimación de la covarianza entre variable ${\ Displaystyle j}$ y variable ${\ Displaystyle k}$ .

La media de la muestra y la matriz de covarianza de la muestra son estimaciones insesgadas de la media y la matriz de covarianza del vector aleatorio. ${\ Displaystyle \ textstyle \ mathbf {X}}$ , un vector cuyo j- ésimo elemento ${\ Displaystyle (j = 1, \, \ ldots, \, K)}$ es una de las variables aleatorias. La razón por la que la matriz de covarianza muestral tiene ${\ Displaystyle \ textstyle N-1}$ en el denominador en lugar de ${\ Displaystyle \ textstyle N}$ es esencialmente que la población significa ${\ Displaystyle \ operatorname {E} (\ mathbf {X})}$ no se conoce y se reemplaza por la media muestral ${\ Displaystyle \ mathbf {\ bar {X}}}$ . Si la población media ${\ Displaystyle \ operatorname {E} (\ mathbf {X})}$ se conoce, la estimación análoga insesgada viene dada por

{\ Displaystyle q_ {jk} = {\ frac {1} {N}} \ sum _ {i = 1} ^ {N} \ left (X_ {ij} - \ operatorname {E} \ left (X_ {j} \ right) \ right) \ left (X_ {ik} - \ operatorname {E} \ left (X_ {k} \ right) \ right)}

.

Generalizaciones

Matriz de covarianza automática de vectores aleatorios reales

Por un vector ${\ Displaystyle \ mathbf {X} = {\ begin {bmatrix} X_ {1} & X_ {2} & \ dots & X_ {m} \ end {bmatrix}} ^ {\ mathrm {T}}}$ de ${\ Displaystyle m}$ Variables aleatorias distribuidas conjuntamente con segundos momentos finitos, su matriz de auto-covarianza (también conocida como matriz de varianza-covarianza o simplemente matriz de covarianza ) ${\ Displaystyle \ operatorname {K} _ {\ mathbf {X} \ mathbf {X}}}$ (también denotado por ${\ Displaystyle \ Sigma (\ mathbf {X})}$ o ${\ Displaystyle \ operatorname {cov} (\ mathbf {X}, \ mathbf {X})}$ ) se define como ^[9]^{: p . 335}

{\ displaystyle {\ begin {alineado} \ operatorname {K} _ {\ mathbf {XX}} = \ operatorname {cov} (\ mathbf {X}, \ mathbf {X}) & = \ operatorname {E} \ left [(\ mathbf {X} - \ operatorname {E} [\ mathbf {X}]) (\ mathbf {X} - \ operatorname {E} [\ mathbf {X}]) ^ {\ mathrm {T}} \ right] \\ & = \ operatorname {E} \ left [\ mathbf {XX} ^ {\ mathrm {T}} \ right] - \ operatorname {E} [\ mathbf {X}] \ operatorname {E} [\ mathbf {X}] ^ {\ mathrm {T}}. \ end {alineado}}}

Dejar ${\ Displaystyle \ mathbf {X}}$ ser un vector aleatorio con matriz de covarianza $Σ$ , y sea $A$ una matriz que pueda actuar sobre ${\ Displaystyle \ mathbf {X}}$ a la izquierda. La matriz de covarianza del producto matriz-vector $AX$ es:

{\ Displaystyle {\ begin {alineado} \ operatorname {cov} (\ mathbf {AX}, \ mathbf {AX}) & = \ operatorname {E} \ left [\ mathbf {AX (A} \ mathbf {X)} ^ {\ mathrm {T}} \ right] - \ operatorname {E} [\ mathbf {AX}] \ operatorname {E} \ left [(\ mathbf {A} \ mathbf {X}) ^ {\ mathrm {T }} \ right] \\ & = \ operatorname {E} \ left [\ mathbf {AXX} ^ {\ mathrm {T}} \ mathbf {A} ^ {\ mathrm {T}} \ right] - \ operatorname { E} [\ mathbf {AX}] \ operatorname {E} \ left [\ mathbf {X} ^ {\ mathrm {T}} \ mathbf {A} ^ {\ mathrm {T}} \ right] \\ & = \ mathbf {A} \ operatorname {E} \ left [\ mathbf {XX} ^ {\ mathrm {T}} \ right] \ mathbf {A} ^ {\ mathrm {T}} - \ mathbf {A} \ operatorname {E} [\ mathbf {X}] \ operatorname {E} \ left [\ mathbf {X} ^ {\ mathrm {T}} \ right] \ mathbf {A} ^ {\ mathrm {T}} \\ & = \ mathbf {A} \ left (\ operatorname {E} \ left [\ mathbf {XX} ^ {\ mathrm {T}} \ right] - \ operatorname {E} [\ mathbf {X}] \ operatorname {E } \ left [\ mathbf {X} ^ {\ mathrm {T}} \ right] \ right) \ mathbf {A} ^ {\ mathrm {T}} \\ & = \ mathbf {A} \ Sigma \ mathbf { A} ^ {\ mathrm {T}}. \ End {alineado}}}

Este es un resultado directo de la linealidad de la expectativa y es útil cuando se aplica una transformación lineal , como una transformación de blanqueamiento , a un vector.

Matriz de covarianza cruzada de vectores aleatorios reales

Para vectores reales aleatorios ${\ Displaystyle \ mathbf {X} \ in \ mathbb {R} ^ {m}}$ y ${\ Displaystyle \ mathbf {Y} \ in \ mathbb {R} ^ {n}}$ , la ${\ Displaystyle m \ times n}$ matriz de covarianza cruzada es igual a ^[9]^{: p.336}

{\ Displaystyle {\ begin {alineado} \ operatorname {K} _ {\ mathbf {X} \ mathbf {Y}} = \ operatorname {cov} (\ mathbf {X}, \ mathbf {Y}) & = \ operatorname {E} \ left [(\ mathbf {X} - \ operatorname {E} [\ mathbf {X}]) (\ mathbf {Y} - \ operatorname {E} [\ mathbf {Y}]) ^ {\ mathrm {T}} \ right] \\ & = \ operatorname {E} \ left [\ mathbf {X} \ mathbf {Y} ^ {\ mathrm {T}} \ right] - \ operatorname {E} [\ mathbf { X}] \ nombre del operador {E} [\ mathbf {Y}] ^ {\ mathrm {T}} \ end {alineado}}}

( Ecuación 2 )

dónde ${\ Displaystyle \ mathbf {Y} ^ {\ mathrm {T}}}$ es la transpuesta del vector (o matriz) ${\ Displaystyle \ mathbf {Y}}$ .

La ${\ Displaystyle (i, j)}$ -th elemento de esta matriz es igual a la covarianza ${\ Displaystyle \ operatorname {cov} (X_ {i}, Y_ {j})}$ entre el $i$ -ésimo componente escalar de ${\ Displaystyle \ mathbf {X}}$ y el $j$ -ésimo componente escalar de ${\ Displaystyle \ mathbf {Y}}$ . En particular, ${\ Displaystyle \ operatorname {cov} (\ mathbf {Y}, \ mathbf {X})}$ es la transposición de ${\ Displaystyle \ operatorname {cov} (\ mathbf {X}, \ mathbf {Y})}$ .

Computación numérica

Cuándo ${\ Displaystyle \ operatorname {E} [XY] \ approx \ operatorname {E} [X] \ operatorname {E} [Y]}$ , la ecuacion ${\ Displaystyle \ operatorname {cov} (X, Y) = \ operatorname {E} \ left [XY \ right] - \ operatorname {E} \ left [X \ right] \ operatorname {E} \ left [Y \ right ]}$ es propenso a una cancelación catastrófica si ${\ Displaystyle \ operatorname {E} \ left [XY \ right]}$ y ${\ Displaystyle \ operatorname {E} \ left [X \ right] \ operatorname {E} \ left [Y \ right]}$ no se calculan exactamente y, por lo tanto, deben evitarse en programas de computadora cuando los datos no se han centrado antes. ^[10] En este caso, deberían preferirse los algoritmos numéricamente estables . ^[11]

Comentarios

La covarianza se denomina a veces una medida de "dependencia lineal" entre las dos variables aleatorias. Eso no significa lo mismo que en el contexto del álgebra lineal (ver dependencia lineal ). Cuando se normaliza la covarianza, se obtiene el coeficiente de correlación de Pearson , que da la bondad del ajuste para la mejor función lineal posible que describe la relación entre las variables. En este sentido, la covarianza es un indicador lineal de dependencia.

Aplicaciones

En genética y biología molecular

La covarianza es una medida importante en biología . Ciertas secuencias de ADN se conservan más que otras entre especies y, por lo tanto, para estudiar las estructuras secundarias y terciarias de las proteínas , o de las estructuras de ARN , se comparan las secuencias en especies estrechamente relacionadas. Si se encuentran cambios de secuencia o no se encuentran cambios en absoluto en el ARN no codificante (como el microARN ), se considera que las secuencias son necesarias para motivos estructurales comunes, como un bucle de ARN. En genética, la covarianza sirve como base para el cálculo de la Matriz de Relaciones Genéticas (GRM) (también conocida como matriz de parentesco), lo que permite la inferencia sobre la estructura de la población a partir de una muestra sin parientes cercanos conocidos, así como la inferencia sobre la estimación de la heredabilidad de rasgos complejos.

En la teoría de la evolución y la selección natural , la ecuación de Price describe cómo un rasgo genético cambia en frecuencia con el tiempo. La ecuación utiliza una covarianza entre un rasgo y la aptitud , para dar una descripción matemática de la evolución y la selección natural. Proporciona una forma de comprender los efectos que la transmisión genética y la selección natural tienen sobre la proporción de genes dentro de cada nueva generación de una población. ^[12]^[13] La ecuación de Price fue derivada por George R. Price , para volver a derivar el trabajo de WD Hamilton sobre la selección de parentesco . Se han elaborado ejemplos de la ecuación de Price para varios casos evolutivos.

En economía financiera

Las covarianzas juegan un papel clave en la economía financiera , especialmente en la teoría moderna de carteras y en el modelo de precios de activos de capital . Las covarianzas entre los rendimientos de varios activos se utilizan para determinar, bajo ciertos supuestos, las cantidades relativas de diferentes activos que los inversores deberían (en un análisis normativo ) o se prevé que (en un análisis positivo ) opten por mantener en un contexto de diversificación .

En asimilación de datos meteorológicos y oceanográficos

La matriz de covarianza es importante para estimar las condiciones iniciales requeridas para ejecutar modelos de pronóstico del tiempo, un procedimiento conocido como asimilación de datos . La 'matriz de covarianza de error de pronóstico' se construye típicamente entre perturbaciones alrededor de un estado medio (ya sea un medio climatológico o de conjunto). La 'matriz de covarianza de errores de observación' se construye para representar la magnitud de los errores de observación combinados (en la diagonal) y los errores correlacionados entre las mediciones (fuera de la diagonal). Este es un ejemplo de su aplicación generalizada al filtrado de Kalman y la estimación de estado más general para sistemas que varían en el tiempo.

En micrometeorología

La técnica de covarianza de remolinos es una técnica clave de medición atmosférica en la que la covarianza entre la desviación instantánea en la velocidad del viento vertical del valor medio y la desviación instantánea en la concentración de gas es la base para calcular los flujos turbulentos verticales.

En procesamiento de señales

La matriz de covarianza se utiliza para capturar la variabilidad espectral de una señal. ^[14]

En estadística y procesamiento de imágenes

La matriz de covarianza se utiliza en el análisis de componentes principales para reducir la dimensionalidad de las características en el preprocesamiento de datos.

Ver también

Algoritmos para calcular la covarianza
Análisis de covarianza
Autocovarianza
Correlación y dependencia
Función de covarianza
Matriz de covarianza
Operador de covarianza
Covarianza de distancia o covarianza browniana.
Covarianza de remolinos
Ley de la covarianza total
Propagación de la incertidumbre

Referencias

^ Arroz, John (2007). Estadística matemática y análisis de datos . Belmont, CA: Brooks / Cole Cengage Learning. pag. 138. ISBN 978-0534-39942-9.
^ Weisstein, Eric W. "Covarianza" . MathWorld .
^ Diccionario de estadística de Oxford, Oxford University Press, 2002, p. 104.
^ a b c d e Park, Kun Il (2018). Fundamentos de Probabilidad y Procesos Estocásticos con Aplicaciones a las Comunicaciones . Saltador. ISBN 978-3-319-68074-3.
^ Yuli Zhang, Huaiyu Wu, Lei Cheng (junio de 2012). Algunas nuevas fórmulas de deformación sobre varianza y covarianza . Actas de la 4ª Conferencia Internacional sobre Modelado, Identificación y Control (ICMIC2012). págs. 987–992.Mantenimiento de CS1: utiliza el parámetro de autores ( enlace )
^ "Covarianza de X e Y | STAT 414/415" . La Universidad Estatal de Pensilvania. Archivado desde el original el 17 de agosto de 2017 . Consultado el 4 de agosto de 2019 .
^ Papoulis (1991). Probabilidad, variables aleatorias y procesos estocásticos . McGraw-Hill.
^ Siegrist, Kyle. "Covarianza y correlación" . Universidad de Alabama en Huntsville . Consultado el 4 de agosto de 2019 .
^ a b Gubner, John A. (2006). Probabilidad y procesos aleatorios para ingenieros eléctricos e informáticos . Prensa de la Universidad de Cambridge. ISBN 978-0-521-86470-1.
^ Donald E. Knuth (1998). El arte de la programación informática , volumen 2: Algoritmos seminuméricos , 3ª ed., P. 232. Boston: Addison-Wesley.
^ Schubert, Erich; Gertz, Michael (2018). "Cálculo paralelo numéricamente estable de (co-) varianza" . Actas de la 30ª Conferencia Internacional sobre Gestión de Bases de Datos Científicas y Estadísticas - SSDBM '18 . Bozen-Bolzano, Italia: ACM Press: 1–12. doi : 10.1145 / 3221269.3223036 . ISBN 9781450365055. S2CID 49665540 .
^ Precio, George (1970). "Selección y covarianza". Naturaleza . 227 (5257): 520–521. doi : 10.1038 / 227520a0 . PMID 5428476 . S2CID 4264723 .
^ Harman, Oren (2020). "Cuando la ciencia refleja la vida: sobre los orígenes de la ecuación de precios" . Phil. Trans. R. Soc. B . 375 (1797): 1–7. doi : 10.1098 / rstb.2019.0352 . PMC 7133509 . PMID 32146891 . Consultado el 15 de mayo de 2020 .
^ Sahidullah, Md .; Kinnunen, Tomi (marzo de 2016). "Características de variabilidad espectral local para la verificación del hablante" . Procesamiento de señales digitales . 50 : 1-11. doi : 10.1016 / j.dsp.2015.10.011 .

[1] Arroz, John (2007). Estadística matemática y análisis de datos . Belmont, CA: Brooks / Cole Cengage Learning. pag. 138. ISBN 978-0534-39942-9.

[2] Weisstein, Eric W. "Covarianza" . MathWorld .

[3] Diccionario de estadística de Oxford, Oxford University Press, 2002, p. 104.

[KunIlPark-4] Park, Kun Il (2018). Fundamentos de Probabilidad y Procesos Estocásticos con Aplicaciones a las Comunicaciones . Saltador. ISBN 978-3-319-68074-3.

[5] Yuli Zhang, Huaiyu Wu, Lei Cheng (junio de 2012). Algunas nuevas fórmulas de deformación sobre varianza y covarianza . Actas de la 4ª Conferencia Internacional sobre Modelado, Identificación y Control (ICMIC2012). págs. 987–992.Mantenimiento de CS1: utiliza el parámetro de autores ( enlace )

[6] "Covarianza de X e Y | STAT 414/415" . La Universidad Estatal de Pensilvania. Archivado desde el original el 17 de agosto de 2017 . Consultado el 4 de agosto de 2019 .

[7] Papoulis (1991). Probabilidad, variables aleatorias y procesos estocásticos . McGraw-Hill.

[8] Siegrist, Kyle. "Covarianza y correlación" . Universidad de Alabama en Huntsville . Consultado el 4 de agosto de 2019 .

[Gubner-9] Gubner, John A. (2006). Probabilidad y procesos aleatorios para ingenieros eléctricos e informáticos . Prensa de la Universidad de Cambridge. ISBN 978-0-521-86470-1.

[10] Donald E. Knuth (1998). El arte de la programación informática , volumen 2: Algoritmos seminuméricos , 3ª ed., P. 232. Boston: Addison-Wesley.

[11] Schubert, Erich; Gertz, Michael (2018). "Cálculo paralelo numéricamente estable de (co-) varianza" . Actas de la 30ª Conferencia Internacional sobre Gestión de Bases de Datos Científicas y Estadísticas - SSDBM '18 . Bozen-Bolzano, Italia: ACM Press: 1–12. doi : 10.1145 / 3221269.3223036 . ISBN 9781450365055. S2CID 49665540 .

[Price1970-12] Precio, George (1970). "Selección y covarianza". Naturaleza . 227 (5257): 520–521. doi : 10.1038 / 227520a0 . PMID 5428476 . S2CID 4264723 .

[Harman2020-13] Harman, Oren (2020). "Cuando la ciencia refleja la vida: sobre los orígenes de la ecuación de precios" . Phil. Trans. R. Soc. B . 375 (1797): 1–7. doi : 10.1098 / rstb.2019.0352 . PMC 7133509 . PMID 32146891 . Consultado el 15 de mayo de 2020 .

[14] Sahidullah, Md .; Kinnunen, Tomi (marzo de 2016). "Características de variabilidad espectral local para la verificación del hablante" . Procesamiento de señales digitales . 50 : 1-11. doi : 10.1016 / j.dsp.2015.10.011 .

[1]