En estadística , la ponderación de la varianza inversa es un método de agregar dos o más variables aleatorias para minimizar la varianza del promedio ponderado. Cada variable aleatoria se pondera en proporción inversa a su varianza, es decir, proporcional a su precisión .
Dada una secuencia de observaciones independientes y i con varianzas σ i 2 , el promedio ponderado de la varianza inversa viene dado por [1]
El promedio ponderado de varianza inversa tiene la menor varianza entre todos los promedios ponderados, que se puede calcular como
Si las varianzas de las mediciones son todas iguales, entonces el promedio ponderado de la varianza inversa se convierte en el promedio simple.
La ponderación de la varianza inversa se utiliza normalmente en el metanálisis estadístico o en la fusión de sensores para combinar los resultados de mediciones independientes.
Contexto
Suponga que un experimentador desea medir el valor de una cantidad, digamos la aceleración debida a la gravedad de la Tierra , cuyo verdadero valor resulta ser. Un experimentador cuidadoso realiza múltiples mediciones, que denotamos con variables aleatorias . Si todos son ruidosos pero no sesgados, es decir, el dispositivo de medición no sobreestima o subestima sistemáticamente el valor real y los errores se dispersan simétricamente, entonces el valor esperado . La dispersión en la medición se caracteriza por la varianza de las variables aleatorias., y si las mediciones se realizan en escenarios idénticos, entonces todos los son los mismos, a los que nos referiremos por . Dado quemediciones, un estimador típico para, denotado como , viene dado por el promedio simple . Tenga en cuenta que este promedio empírico también es una variable aleatoria, cuyo valor de expectativa es pero también tiene una dispersión. Si las medidas individuales no están correlacionadas, el cuadrado del error en la estimación viene dado por. Por tanto, si todos los son iguales, entonces el error en la estimación disminuye con el aumento en como , por lo que se prefieren más observaciones.
En vez de mediciones repetidas con un instrumento, si el experimentador hace de la misma cantidad con diferentes instrumentos con diferentes calidades de medición, entonces no hay razón para esperar diferentes ser el mismo. Algunos instrumentos pueden ser más ruidosos que otros. En el ejemplo de medición de la aceleración debida a la gravedad, los diferentes "instrumentos" podrían medirdesde un péndulo simple , desde el análisis de un movimiento de proyectil, etc. El promedio simple ya no es un estimador óptimo, ya que el error enEn realidad, podría exceder el error en la medición menos ruidosa si diferentes mediciones tienen errores muy diferentes. En lugar de descartar las medidas ruidosas que aumentan el error final, el experimentador puede combinar todas las medidas con pesos apropiados para dar más importancia a las medidas menos ruidosas y viceversa. Dado el conocimiento de, un estimador óptimo para medir sería una media ponderada de las medidas, para la elección particular de los pesos . La varianza del estimador, que para la elección óptima de los pesos se convierte en
Tenga en cuenta que desde , el estimador tiene una dispersión menor que la dispersión en cualquier medición individual. Además, la dispersión en disminuye al agregar más mediciones, por más ruidosas que sean esas mediciones.
Derivación
Considere una suma ponderada genérica , donde los pesos están normalizados de manera que . Si el son todos independientes, la varianza de es dado por
Para la optimización, deseamos minimizar que se puede hacer equiparando el gradiente con respecto a los pesos de a cero, manteniendo la restricción de que . El uso de un multiplicador de Lagrange para hacer cumplir la restricción, expresamos la varianza
Para ,
lo que implica que
La principal conclusión aquí es que . Desde,
Los pesos normalizados individuales son
Es fácil ver que esta solución extremum corresponde al mínimo de la segunda derivada parcial señalando que la varianza es una función cuadrática de los pesos. Por tanto, la varianza mínima del estimador viene dada por
Distribuciones normales
Para las variables aleatorias distribuidas normalmente, los promedios ponderados de varianza inversa también se pueden derivar como la estimación de máxima verosimilitud para el valor verdadero. Además, desde una perspectiva bayesiana , la distribución posterior del valor real dadas las observaciones distribuidas normalmente y una a priori plana es una distribución normal con el promedio ponderado de varianza inversa como media y varianza
Caso multivariado
Para distribuciones multivariadas, un argumento equivalente conduce a una ponderación óptima basada en las matrices de covarianza. de las estimaciones individuales :
Para distribuciones multivariadas, el término promedio "ponderado con precisión" se usa más comúnmente.
Ver también
Referencias
- ^ Joachim Hartung; Guido Knapp; Bimal K. Sinha (2008). Metanálisis estadístico con aplicaciones . John Wiley e hijos . ISBN 978-0-470-29089-7.