Los cuadrados mínimos recortados ( LTS ), o la suma de cuadrados mínima recortada , es un método estadístico robusto que ajusta una función a un conjunto de datos sin verse afectado indebidamente por la presencia de valores atípicos . Es uno de varios métodos de regresión robusta .
Descripción del método
En lugar del método estándar de mínimos cuadrados , que minimiza la suma de residuos cuadrados sobre n puntos, el método LTS intenta minimizar la suma de residuos cuadrados sobre un subconjunto,, de esos puntos. El no utilizado los puntos no influyen en el ajuste.
En un problema de mínimos cuadrados estándar, los valores estimados de los parámetros β se definen como aquellos valores que minimizan la función objetivo S (β) de los residuos al cuadrado:
donde los residuales se definen como las diferencias entre los valores de las variables dependientes (observaciones) y los valores del modelo:
y donde n es el número total de puntos de datos. Para un análisis de mínimos cuadrados recortados, esta función objetivo se reemplaza por una construida de la siguiente manera. Para un valor fijo de β, seadenotar el conjunto de valores absolutos ordenados de los residuos (en orden creciente de valor absoluto). En esta notación, la función estándar de suma de cuadrados es
mientras que la función objetivo para LTS es
Consideraciones computacionales
Debido a que este método es binario, ya que los puntos se incluyen o se excluyen, no existe una solución de forma cerrada. Como resultado, los métodos para encontrar la solución LTS examinan combinaciones de datos, intentando encontrar el subconjunto k que produce la suma más baja de residuos cuadrados. Existen métodos para n bajo que encontrarán la solución exacta; sin embargo, a medida que n aumenta, el número de combinaciones crece rápidamente, dando lugar a métodos que intentan encontrar soluciones aproximadas (pero generalmente suficientes).
Referencias
- Rousseeuw, PJ (1984). "Regresión de la mediana mínima de cuadrados". Revista de la Asociación Estadounidense de Estadística . 79 (388): 871–880. doi : 10.1080 / 01621459.1984.10477105 . JSTOR 2288718 .
- Rousseeuw, PJ; Leroy, AM (2005) [1987]. Regresión robusta y detección de valores atípicos . Wiley. doi : 10.1002 / 0471725382 . ISBN 978-0-471-85233-9.
- Li, LM (2005). "Un algoritmo para calcular la estimación exacta de cuadrados mínimos recortados de regresión lineal simple con restricciones". Estadística computacional y análisis de datos . 48 (4): 717–734. doi : 10.1016 / j.csda.2004.04.003 .
- Atkinson, AC; Cheng, T.-C. (1999). "Cálculo de regresión de cuadrados mínimos recortados con la búsqueda hacia adelante". Estadística y Computación . 9 (4): 251–263. doi : 10.1023 / A: 1008942604045 .
- Jung, Kang-Mo (2007). "Estimador de mínimos cuadrados recortados en el modelo de errores en variables". Revista de estadísticas aplicadas . 34 (3): 331–338. doi : 10.1080 / 02664760601004973 .