De Wikipedia, la enciclopedia libre
Saltar a navegación Saltar a búsqueda

En estadística , una región de confianza es una generalización multidimensional de un intervalo de confianza . Es un conjunto de puntos en un espacio n -dimensional, a menudo representado como un elipsoide alrededor de un punto que es una solución estimada a un problema, aunque pueden ocurrir otras formas.

Interpretación [ editar ]

La región de confianza se calcula de tal manera que si un conjunto de mediciones se repitiera muchas veces y se calculara una región de confianza de la misma manera en cada conjunto de mediciones, entonces un cierto porcentaje del tiempo (por ejemplo, 95%) la región de confianza sería incluir el punto que representa los valores "verdaderos" del conjunto de variables que se están estimando. Sin embargo, a menos que se hagan ciertas suposiciones sobre probabilidades previas , no significa, cuando se ha calculado una región de confianza, que haya un 95% de probabilidad de que los valores "verdaderos" se encuentren dentro de la región, ya que no asumimos ninguna probabilidad en particular. distribución de los valores "verdaderos" y es posible que tengamos o no otra información sobre dónde es probable que se encuentren.

El caso de errores independientes, idénticamente distribuidos normalmente [ editar ]

Supongamos que hemos encontrado una solución al siguiente problema sobredeterminado:

donde Y es un vector de columna n- dimensional que contiene valores observados de la variable dependiente , X es una matriz n- por- p de valores observados de variables independientes (que pueden representar un modelo físico) que se supone que se conoce exactamente, es un vector de columna que contiene los p parámetros que se van a estimar, y es un vector de columna de n- dimensiones de errores que se supone que se distribuyen de forma independiente con distribuciones normales con media cero y cada una con la misma varianza desconocida .

Una región de confianza conjunta del 100 (1 -  α )% para los elementos de está representada por el conjunto de valores del vector b que satisfacen la siguiente desigualdad: [1]

donde la variable b representa cualquier punto en la región de confianza, p es el número de parámetros, es decir, el número de elementos del vector es el vector de parámetros estimados, y s 2 es el chi cuadrado reducido , una estimación insesgada de igual a

Además, F es la función cuantil de la distribución F , con p y grados de libertad , es la significación estadística de nivel, y el símbolo significa que la transposición de .

La expresión se puede reescribir como:

donde es la matriz de covarianza escalada por mínimos cuadrados de .

La desigualdad anterior define una región elipsoidal en el espacio p -dimensional de parámetros cartesianos R p . El centro del elipsoide está en la estimación . Según Press et al., Es más fácil trazar el elipsoide después de realizar la descomposición de valores singulares . Las longitudes de los ejes del elipsoide son proporcionales a los recíprocos de los valores en las diagonales de la matriz diagonal, y las direcciones de estos ejes están dadas por las filas de la tercera matriz de la descomposición.

Mínimos cuadrados ponderados y generalizados [ editar ]

Ahora considere el caso más general donde algunos elementos distintos tienen una covarianza distinta de cero conocida (en otras palabras, los errores en las observaciones no se distribuyen de forma independiente), y / o las desviaciones estándar de los errores no son todas iguales. Suponga que la matriz de covarianza de es , donde V es una matriz n- por- n no singular que era igual a en el caso más específico tratado en la sección anterior, (donde I es la matriz identidad ,) pero aquí se permite tener un valor distinto de cero. -Elementos diagonales representa la covarianza de pares de observaciones individuales, además de no tener necesariamente todos los elementos diagonales iguales.

Es posible encontrar [2] una matriz simétrica no singular P tal que

En efecto, P es una raíz cuadrada de la matriz de covarianzas V .

El problema de los mínimos cuadrados

luego se puede transformar multiplicando a la izquierda cada término por el inverso de P , formando la nueva formulación del problema

dónde

y

Una región de confianza conjunta para los parámetros, es decir, para los elementos de , está delimitada por el elipsoide dado por: [3]

Aquí F representa el punto porcentual de la distribución F y las cantidades p y np son los grados de libertad que son los parámetros de esta distribución.

Problemas no lineales [ editar ]

Las regiones de confianza se pueden definir para cualquier distribución de probabilidad. El experimentador puede elegir el nivel de significancia y la forma de la región, y luego el tamaño de la región está determinado por la distribución de probabilidad. Una opción natural es utilizar como límite un conjunto de puntos con valores constantes ( chi-cuadrado ).

Un enfoque consiste en utilizar una aproximación lineal al modelo no lineal, que puede ser una aproximación cercana en la vecindad de la solución, y luego aplicar el análisis de un problema lineal para encontrar una región de confianza aproximada. Este puede ser un enfoque razonable si la región de confianza no es muy grande y las segundas derivadas del modelo tampoco lo son.

También se pueden utilizar enfoques de bootstrapping . [4]

Consulte Metodologías de cuantificación de la incertidumbre para conocer la propagación de la incertidumbre hacia adelante para conocer los conceptos relacionados.

Ver también [ editar ]

  • Error circular probable
  • Regresión lineal
  • Banda de confianza

Notas [ editar ]

  1. ^ Draper y Smith (1981, p. 94)
  2. ^ Draper y Smith (1981, p. 108)
  3. ^ Draper y Smith (1981, p. 109)
  4. ^ Hutton TJ, Buxton BF, Hammond P, Potts HWW (2003). Estimación de las trayectorias de crecimiento promedio en el espacio de forma utilizando el suavizado de kernel. Transacciones IEEE sobre imágenes médicas , 22 (6): 747-53

Referencias [ editar ]

  • Draper, NR; H. Smith (1981) [1966]. Análisis de regresión aplicado (2ª ed.). Estados Unidos: John Wiley and Sons Ltd. ISBN 0-471-02995-5.
  • Presione, WH; SA Teukolsky; WT Vetterling; BP Flannery (1992) [1988]. Recetas numéricas en C: El arte de la informática científica (2ª ed.). Cambridge, Reino Unido: Cambridge University Press.

Enlaces externos [ editar ]