Ponderación de varianza inversa

En estadística , la ponderación de la varianza inversa es un método de agregar dos o más variables aleatorias para minimizar la varianza del promedio ponderado. Cada variable aleatoria se pondera en proporción inversa a su varianza, es decir, proporcional a su precisión .

Dada una secuencia de observaciones independientes $y i$ con varianzas $σ i 2$ , el promedio ponderado de la varianza inversa viene dado por ^[1]

{\ Displaystyle {\ hat {y}} = {\ frac {\ sum _ {i} y_ {i} / \ sigma _ {i} ^ {2}} {\ sum _ {i} 1 / \ sigma _ { i} ^ {2}}}.}

El promedio ponderado de varianza inversa tiene la menor varianza entre todos los promedios ponderados, que se puede calcular como

{\ Displaystyle Var ({\ hat {y}}) = {\ frac {1} {\ sum _ {i} 1 / \ sigma _ {i} ^ {2}}}.}

Si las varianzas de las mediciones son todas iguales, entonces el promedio ponderado de la varianza inversa se convierte en el promedio simple.

La ponderación de la varianza inversa se utiliza normalmente en el metanálisis estadístico o en la fusión de sensores para combinar los resultados de mediciones independientes.

Contexto

Suponga que un experimentador desea medir el valor de una cantidad, digamos la aceleración debida a la gravedad de la Tierra , cuyo verdadero valor resulta ser ${\ Displaystyle \ mu}$ . Un experimentador cuidadoso realiza múltiples mediciones, que denotamos con ${\ Displaystyle n}$ variables aleatorias ${\ Displaystyle X_ {1}, X_ {2}, ..., X_ {n}}$ . Si todos son ruidosos pero no sesgados, es decir, el dispositivo de medición no sobreestima o subestima sistemáticamente el valor real y los errores se dispersan simétricamente, entonces el valor esperado ${\ Displaystyle E [X_ {i}] = \ mu}$ ${\ Displaystyle \ forall i}$ . La dispersión en la medición se caracteriza por la varianza de las variables aleatorias. ${\ Displaystyle Var (X_ {i}): = \ sigma _ {i} ^ {2}}$ , y si las mediciones se realizan en escenarios idénticos, entonces todos los ${\ Displaystyle \ sigma _ {i}}$ son los mismos, a los que nos referiremos por ${\ Displaystyle \ sigma}$ . Dado que ${\ Displaystyle n}$ mediciones, un estimador típico para ${\ Displaystyle \ mu}$ , denotado como ${\ Displaystyle {\ hat {\ mu}}}$ , viene dado por el promedio simple ${\ Displaystyle {\ overline {X}} = {\ frac {1} {n}} \ sum _ {i} X_ {i}}$ . Tenga en cuenta que este promedio empírico también es una variable aleatoria, cuyo valor de expectativa ${\ Displaystyle E [{\ overline {X}}]}$ es ${\ Displaystyle \ mu}$ pero también tiene una dispersión. Si las medidas individuales no están correlacionadas, el cuadrado del error en la estimación viene dado por ${\ Displaystyle Var ({\ overline {X}}) = {\ frac {1} {n ^ {2}}} \ sum _ {i} \ sigma _ {i} ^ {2} = \ left ({\ frac {\ sigma} {\ sqrt {n}}} \ right) ^ {2}}$ . Por tanto, si todos los ${\ Displaystyle \ sigma _ {i}}$ son iguales, entonces el error en la estimación disminuye con el aumento en ${\ Displaystyle n}$ como ${\ Displaystyle 1 / {\ sqrt {n}}}$ , por lo que se prefieren más observaciones.

En vez de ${\ Displaystyle n}$ mediciones repetidas con un instrumento, si el experimentador hace ${\ Displaystyle n}$ de la misma cantidad con ${\ Displaystyle n}$ diferentes instrumentos con diferentes calidades de medición, entonces no hay razón para esperar diferentes ${\ Displaystyle \ sigma _ {i}}$ ser el mismo. Algunos instrumentos pueden ser más ruidosos que otros. En el ejemplo de medición de la aceleración debida a la gravedad, los diferentes "instrumentos" podrían medir ${\ Displaystyle g}$ desde un péndulo simple , desde el análisis de un movimiento de proyectil, etc. El promedio simple ya no es un estimador óptimo, ya que el error en ${\ Displaystyle {\ overline {X}}}$ En realidad, podría exceder el error en la medición menos ruidosa si diferentes mediciones tienen errores muy diferentes. En lugar de descartar las medidas ruidosas que aumentan el error final, el experimentador puede combinar todas las medidas con pesos apropiados para dar más importancia a las medidas menos ruidosas y viceversa. Dado el conocimiento de ${\ Displaystyle \ sigma _ {1} ^ {2}, \ sigma _ {2} ^ {2}, ..., \ sigma _ {n} ^ {2}}$ , un estimador óptimo para medir ${\ Displaystyle \ mu}$ sería una media ponderada de las medidas ${\ Displaystyle {\ hat {\ mu}} = {\ frac {\ sum _ {i} w_ {i} X_ {i}} {\ sum _ {i} w_ {i}}}}$ , para la elección particular de los pesos ${\ Displaystyle w_ {i} = 1 / \ sigma _ {i} ^ {2}}$ . La varianza del estimador ${\ Displaystyle Var ({\ hat {\ mu}}) = {\ frac {\ sum _ {i} w_ {i} ^ {2} \ sigma _ {i} ^ {2}} {\ left (\ sum _ {i} w_ {i} \ right) ^ {2}}}}$ , que para la elección óptima de los pesos se convierte en ${\ Displaystyle Var ({\ hat {\ mu}} _ {\ text {opt}}) = \ left (\ sum _ {i} \ sigma _ {i} ^ {- 2} \ right) ^ {- 1 }.}$

Tenga en cuenta que desde ${\ Displaystyle Var ({\ hat {\ mu}} _ {\ text {opt}}) <\ min _ {j} \ sigma _ {j} ^ {2}}$ , el estimador tiene una dispersión menor que la dispersión en cualquier medición individual. Además, la dispersión en ${\ displaystyle {\ hat {\ mu}} _ {\ text {opt}}}$ disminuye al agregar más mediciones, por más ruidosas que sean esas mediciones.

Derivación

Considere una suma ponderada genérica ${\ Displaystyle Y = \ sum _ {i} w_ {i} X_ {i}}$ , donde los pesos ${\ Displaystyle w_ {i}}$ están normalizados de manera que ${\ Displaystyle \ sum _ {i} w_ {i} = 1}$ . Si el ${\ Displaystyle X_ {i}}$ son todos independientes, la varianza de ${\ Displaystyle Y}$ es dado por

{\ Displaystyle Var (Y) = \ sum _ {i} w_ {i} ^ {2} \ sigma _ {i} ^ {2}.}

Para la optimización, deseamos minimizar ${\ Displaystyle Var (Y)}$ que se puede hacer equiparando el gradiente con respecto a los pesos de ${\ Displaystyle Var (Y)}$ a cero, manteniendo la restricción de que ${\ Displaystyle \ sum _ {i} w_ {i} = 1}$ . El uso de un multiplicador de Lagrange ${\ Displaystyle w_ {0}}$ para hacer cumplir la restricción, expresamos la varianza

{\ Displaystyle Var (Y) = \ sum _ {i} w_ {i} ^ {2} \ sigma _ {i} ^ {2} -w_ {0} (\ sum _ {i} w_ {i} -1 ).}

Para ${\ Displaystyle k> 0}$ ,

{\ Displaystyle 0 = {\ frac {\ parcial} {\ parcial w_ {k}}} Var (Y) = 2w_ {k} \ sigma _ {k} ^ {2} -w_ {0},}

lo que implica que

{\ Displaystyle w_ {k} = {\ frac {w_ {0} / 2} {\ sigma _ {k} ^ {2}}}.}

La principal conclusión aquí es que ${\ Displaystyle w_ {k} \ propto 1 / \ sigma _ {k} ^ {2}}$ . Desde ${\ Displaystyle \ sum _ {i} w_ {i} = 1}$ ,

{\ Displaystyle {\ frac {2} {w_ {0}}} = \ sum _ {i} {\ frac {1} {\ sigma _ {i} ^ {2}}}: = {\ frac {1} {\ sigma _ {0} ^ {2}}}.}

Los pesos normalizados individuales son

{\ Displaystyle w_ {k} = {\ frac {1} {\ sigma _ {k} ^ {2}}} \ left (\ sum _ {i} {\ frac {1} {\ sigma _ {i} ^ {2}}} \ right) ^ {- 1}.}

Es fácil ver que esta solución extremum corresponde al mínimo de la segunda derivada parcial señalando que la varianza es una función cuadrática de los pesos. Por tanto, la varianza mínima del estimador viene dada por

{\ Displaystyle Var (Y) = \ sum _ {i} {\ frac {\ sigma _ {0} ^ {4}} {\ sigma _ {i} ^ {4}}} \ sigma _ {i} ^ { 2} = \ sigma _ {0} ^ {4} \ sum _ {i} {\ frac {1} {\ sigma _ {i} ^ {2}}} = \ sigma _ {0} ^ {4} { \ frac {1} {\ sigma _ {0} ^ {2}}} = \ sigma _ {0} ^ {2} = {\ frac {1} {\ sum _ {i} 1 / \ sigma _ {i } ^ {2}}}.}

Distribuciones normales

Para las variables aleatorias distribuidas normalmente, los promedios ponderados de varianza inversa también se pueden derivar como la estimación de máxima verosimilitud para el valor verdadero. Además, desde una perspectiva bayesiana , la distribución posterior del valor real dadas las observaciones distribuidas normalmente ${\ Displaystyle y_ {i}}$ y una a priori plana es una distribución normal con el promedio ponderado de varianza inversa como media y varianza ${\ Displaystyle Var (Y)}$

Caso multivariado

Para distribuciones multivariadas, un argumento equivalente conduce a una ponderación óptima basada en las matrices de covarianza. ${\ Displaystyle \ Sigma _ {i}}$ de las estimaciones individuales ${\ Displaystyle x_ {i}}$ :

{\ Displaystyle {\ hat {x}} = \ left (\ sum _ {i} \ Sigma _ {i} ^ {- 1} \ right) ^ {- 1} \ sum _ {i} \ Sigma _ {i } ^ {- 1} x_ {i}}

{\ Displaystyle Var ({\ hat {x}}) = \ left (\ sum _ {i} \ Sigma _ {i} ^ {- 1} \ right) ^ {- 1}}

Para distribuciones multivariadas, el término promedio "ponderado con precisión" se usa más comúnmente.

Ver también

Mínimos cuadrados ponderados

Referencias

^ Joachim Hartung; Guido Knapp; Bimal K. Sinha (2008). Metanálisis estadístico con aplicaciones . John Wiley e hijos . ISBN 978-0-470-29089-7.

[1] Joachim Hartung; Guido Knapp; Bimal K. Sinha (2008). Metanálisis estadístico con aplicaciones . John Wiley e hijos . ISBN 978-0-470-29089-7.

[1]