En estadística , la estadística de chi-cuadrado reducida se usa ampliamente en las pruebas de bondad de ajuste . También se conoce como desviación cuadrática media ponderada ( MSWD ) en la datación isotópica [1] y varianza del peso unitario en el contexto de mínimos cuadrados ponderados . [2] [3]
Su raíz cuadrada se llama error estándar de regresión , [4] error estándar de la regresión , [5] [6] o error estándar de la ecuación [7] (ver Mínimos cuadrados ordinarios # Chi-cuadrado reducido )
Definición
Se define como chi-cuadrado por grado de libertad : [8] [9] [10] [11] [12] [13] [14] [15]
donde el chi-cuadrado es una suma ponderada de desviaciones al cuadrado :
con entradas: varianza , Observaciones O , y calculado de datos C . [8] El grado de libertad,, es igual al número de observaciones n menos el número de parámetros ajustados m .
En mínimos cuadrados ponderados , la definición a menudo se escribe en notación matricial como
donde r es el vector de residuos y W es la matriz de ponderaciones, la inversa de la matriz de covarianza de las observaciones de entrada (diagonal). Si W no es diagonal, se aplican los mínimos cuadrados generalizados .
En mínimos cuadrados ordinarios , la definición se simplifica a:
donde el numerador es la suma residual de cuadrados (RSS).
Discusión
Como regla general, cuando la varianza del error de medición se conoce a priori , unindica un ajuste deficiente del modelo. Aindica que el ajuste no ha capturado completamente los datos (o que la varianza del error se ha subestimado). En principio, un valor de alrededor indica que el grado de coincidencia entre las observaciones y las estimaciones está de acuerdo con la varianza del error. Aindica que el modelo está "sobreajustando" los datos: o el modelo se ajusta incorrectamente al ruido o la varianza del error se ha sobreestimado. [dieciséis]
Cuando la varianza del error de medición se conoce solo parcialmente, el chi-cuadrado reducido puede servir como una corrección estimada a posteriori , consulte la media aritmética ponderada # Corrección de la dispersión excesiva o insuficiente .
Aplicaciones
Geocronología
En geocronología , el MSWD es una medida de bondad de ajuste que tiene en cuenta la importancia relativa de la reproducibilidad tanto interna como externa, con el uso más común en la datación isotópica. [17] [18] [1] [19] [20] [21]
En general cuando:
MSWD = 1 si los datos de edad se ajustan a una distribución normal univariante en el espacio t (para la edad media aritmética ) o log ( t ) (para la edad media geométrica ), o si los datos de composición se ajustan a una distribución normal bivariada en [log ( U / He ), log ( Th / He)] - espacio (para la edad central).
MSWD <1 si la dispersión observada es menor que la predicha por las incertidumbres analíticas. En este caso, se dice que los datos están "poco dispersos", lo que indica que las incertidumbres analíticas se sobrestimaron.
MSWD> 1 si la dispersión observada excede la predicha por las incertidumbres analíticas. En este caso, se dice que los datos están "sobredispersados". Esta situación es la regla más que la excepción en la geocronología (U-Th) / He, lo que indica una comprensión incompleta del sistema de isótopos. Se han propuesto varias razones para explicar la sobredispersión de datos (U-Th) / He, incluidas distribuciones U-Th distribuidas de manera desigual y daños por radiación.
A menudo, el geocronólogo determinará una serie de mediciones de edad en una sola muestra, con el valor medido tener una ponderación y un error asociado para cada determinación de edad. En cuanto a la ponderación, se pueden ponderar todas las edades medidas por igual o ponderarlas por la proporción de la muestra que representan. Por ejemplo, si se utilizaron dos tercios de la muestra para la primera medición y un tercio para la segunda y última medición, entonces se podría ponderar la primera medición el doble que la segunda.
La media aritmética de las determinaciones de edad es
pero este valor puede inducir a error, a menos que cada determinación de la edad tenga la misma importancia.
Cuando se puede suponer que cada valor medido tiene la misma ponderación o significancia, los estimadores sesgados e insesgados (o " muestra " y "población" respectivamente) de la varianza se calculan de la siguiente manera:
La desviación estándar es la raíz cuadrada de la varianza.
Cuando las determinaciones individuales de una edad no tienen la misma importancia, es mejor utilizar una media ponderada para obtener una edad "promedio", de la siguiente manera:
Se puede demostrar que el estimador de varianza ponderado sesgado es
que se puede calcular como
El estimador ponderado insesgado de la varianza muestral se puede calcular de la siguiente manera:
Nuevamente, la desviación estándar correspondiente es la raíz cuadrada de la varianza.
El estimador ponderado insesgado de la varianza muestral también se puede calcular sobre la marcha de la siguiente manera:
El cuadrado medio no ponderado de las desviaciones ponderadas (MSWD no ponderado) se puede calcular de la siguiente manera:
Por analogía, el cuadrado medio ponderado de las desviaciones ponderadas (MSWD ponderado) se puede calcular de la siguiente manera:
Análisis de Rasch
En el análisis de datos basado en el modelo de Rasch , el estadístico de Chi cuadrado reducido se denomina estadístico de la media cuadrática del atuendo, y el estadístico de Chi cuadrado reducido ponderado por información se denomina estadístico de la media cuadrática infit. [22]
Referencias
- ^ a b Wendt, I. y Carl, C., 1991, La distribución estadística de la desviación ponderada cuadrática media, Chemical Geology, 275-285.
- ^ Álgebra lineal, geodesia y GPS , por Gilbert Strang, Kai Borre
- ^ Estimación de parámetros y prueba de hipótesis en modelos lineales, por Karl-Rudolf Koch [1]
- ^ Julian Faraway (2000), regresión práctica y Anova usando R
- ^ Kenney, J .; Manteniendo, ES (1963). Matemática de la Estadística . van Nostrand. pag. 187.
- ^ Zwillinger, D. (1995). Tablas y fórmulas matemáticas estándar . Chapman y Hall / CRC. pag. 626. ISBN 0-8493-2479-3.
- ^ Hayashi, Fumio (2000). Econometría . Prensa de la Universidad de Princeton. ISBN 0-691-01018-8.
- ^ a b Laub, Charlie; Kuhl, Tonya L. (nd), ¿Qué tan malo es bueno? A Critical Look at the Fitting of Reflectivity Models using the Reduced Chi-Square Statistic (PDF) , University California, Davis, archivado del original (PDF) el 6 de octubre de 2016 , consultado el 30 de mayo de 2015
- ^ Taylor, John Robert (1997), Introducción al análisis de errores , University Science Books, pág. 268
- ^ Kirkman, TW (nd), Chi-Square Curve Fitting , consultado el 30 de mayo de 2015
- ^ Bevington , 1969 , p. 85
- ^ Medidas y sus incertidumbres: una guía práctica para el análisis de errores moderno, por Ifan Hughes, Thomas Hase [2]
- ^ Enfrentando las incertidumbres: una guía para el análisis de errores, por Manfred Drosg [3]
- ^ Estadísticas prácticas para astrónomos, por JV Wall, CR Jenkins
- ^ Métodos computacionales en física e ingeniería, por Samuel Shaw Ming Wong [4]
- ^ Bevington, Philip R. (1969), Reducción de datos y análisis de errores para las ciencias físicas , Nueva York: McGraw-Hill, p. 89,
Para pruebas de χ 2 , χ ν 2 debe ser aproximadamente igual a uno.
- ^ Dickin, AP 1995. Geología de isótopos radiogénicos. Cambridge University Press, Cambridge, Reino Unido, 1995, ISBN 0-521-43151-4 , ISBN 0-521-59891-5
- ^ McDougall, I. y Harrison, TM 1988. Geocronología y termocronología por elmétodo 40 Ar / 39 Ar. Prensa de la Universidad de Oxford.
- ^ Lance P. Black, Sandra L. Kamo, Charlotte M. Allen, John N. Aleinikoff, Donald W. Davis, Russell J. Korsch, Chris Foudoulis 2003. TEMORA 1: un nuevo estándar de circón para la geocronología fanerozoica U – Pb. Chemical Geology 200, 155-170.
- ^ MJ Streule, RJ Phillips, MP Searle, DJ Waters y MSA Horstwood 2009. Evolución y cronología del complejo metamórfico de Pangong adyacente a la falla de Karakoram de modelado y geocronología U-Pb, Ladakh: restricciones de termobarometría, modelado metamórfico y geocronología U-Pb. Revista de la Sociedad Geológica 166, 919–932 doi : 10.1144 / 0016-76492008-117
- ^ Roger Powell, Janet Hergt , Jon Woodhead 2002. Mejora de los cálculos de isócronas con estadísticas robustas y bootstrap. Chemical Geology 185, 191-204.
- ^ Linacre, JM (2002). "¿Qué significan Infit y Outfit, Mean-Square y Standardized?" . Transacciones de medición de Rasch . 16 (2): 878.