regresión local

La regresión local o regresión polinomial local , ^[1] también conocida como regresión móvil , ^[2] es una generalización de la media móvil y la regresión polinomial . ^[3] Sus métodos más comunes, inicialmente desarrollados para el suavizado de diagramas de dispersión , son LOESS ( suavizado de diagramas de dispersión estimado localmente ) y LOWESS ( suavizado de diagramas de dispersión ponderados localmente ), ambos pronunciados / ˈ l oʊ ɛ s / . son dos fuertemente relacionadosmétodos de regresión no paramétricos que combinan múltiples modelos de regresión en un metamodelo basado en el vecino más cercano . En algunos campos, LOESS se conoce y comúnmente se denomina filtro Savitzky-Golay ^[4]^[5] (propuesto 15 años antes que LOESS).

LOESS y LOWESS, por lo tanto, se basan en métodos "clásicos" , como la regresión lineal y no lineal de mínimos cuadrados . Abordan situaciones en las que los procedimientos clásicos no funcionan bien o no se pueden aplicar de manera efectiva sin trabajo indebido. LOESS combina gran parte de la simplicidad de la regresión lineal de mínimos cuadrados con la flexibilidad de la regresión no lineal . Lo hace ajustando modelos simples a subconjuntos localizados de los datos para construir una función que describa la parte determinista de la variación en los datos, punto por punto. De hecho, uno de los principales atractivos de este método es que no se requiere que el analista de datos especifique una función global de ninguna forma para ajustar un modelo a los datos, solo para ajustar segmentos de los datos.

La contrapartida de estas características es un mayor cálculo. Debido a que es tan computacionalmente intensivo, LOESS habría sido prácticamente imposible de usar en la era en que se estaba desarrollando la regresión de mínimos cuadrados. La mayoría de los otros métodos modernos para el modelado de procesos son similares a LOESS en este aspecto. Estos métodos han sido diseñados conscientemente para utilizar nuestra capacidad computacional actual con la mayor ventaja posible para lograr objetivos que no son fáciles de lograr con los enfoques tradicionales.

Una curva suave a través de un conjunto de puntos de datos obtenidos con esta técnica estadística se denomina curva de loess , particularmente cuando cada valor suavizado viene dado por una regresión de mínimos cuadrados cuadráticos ponderados sobre el intervalo de valores de la variable de criterio del diagrama de dispersión del eje y . Cuando cada valor suavizado viene dado por una regresión de mínimos cuadrados lineales ponderados sobre el lapso, esto se conoce como curva de mínimos ; sin embargo, algunas autoridades tratan lowess y loess como sinónimos ^[^{cita requerida}^] .

En 1964, Savitsky y Golay propusieron un método equivalente a LOESS, que comúnmente se conoce como filtro Savitzky-Golay .William S. Cleveland redescubrió el método en 1979 y le dio un nombre distinto. El método fue desarrollado posteriormente por Cleveland y Susan J. Devlin (1988). LOWESS también se conoce como regresión polinómica ponderada localmente.

En cada punto del rango del conjunto de datos, se ajusta un polinomio de bajo grado a un subconjunto de datos, con valores de variables explicativas cerca del punto cuya respuesta se estima. El polinomio se ajusta usando mínimos cuadrados ponderados , dando más peso a los puntos cercanos al punto cuya respuesta se está estimando y menos peso a los puntos más alejados. Luego, el valor de la función de regresión para el punto se obtiene evaluando el polinomio local utilizando los valores de la variable explicativa para ese punto de datos. El ajuste LOESS se completa después de que se hayan calculado los valores de la función de regresión para cada uno de los ${\ estilo de visualización n}$ puntos de datos. Muchos de los detalles de este método, como el grado del modelo polinomial y los pesos, son flexibles. El rango de opciones para cada parte del método y los valores predeterminados típicos se analizan brevemente a continuación.

Curva LOESS ajustada a una población muestreada a partir de una onda sinusoidal con ruido uniforme añadido. La curva LOESS se aproxima a la onda sinusoidal original.