En estadística , la validación de regresión es el proceso de decidir si los resultados numéricos que cuantifican las relaciones hipotéticas entre variables, obtenidos del análisis de regresión , son aceptables como descripciones de los datos. El proceso de validación puede implicar analizar la bondad del ajuste de la regresión, analizar si los residuos de la regresión son aleatorios y verificar si el rendimiento predictivo del modelo se deteriora sustancialmente cuando se aplica a datos que no se utilizaron en la estimación del modelo.
Bondad de ajuste
Una medida de bondad de ajuste es el R 2 ( coeficiente de determinación ), que en mínimos cuadrados ordinarios con una intersección varía entre 0 y 1. Sin embargo, un R 2 cercano a 1 no garantiza que el modelo se ajuste bien a los datos: como El cuarteto de Anscombe muestra que un alto R 2 puede ocurrir en presencia de una especificación incorrecta de la forma funcional de una relación o en presencia de valores atípicos que distorsionan la verdadera relación.
Un problema con el R 2 como una medida de la validez del modelo es que siempre se puede aumentar mediante la adición de más variables en el modelo, excepto en el caso improbable de que las variables adicionales no están correlacionadas exactamente con la variable dependiente en la muestra de datos que se utiliza. Este problema se puede evitar haciendo una prueba F de la significancia estadística del aumento en el R 2 , o usando en su lugar el R 2 ajustado .
Análisis de residuos
Los residuos de un modelo ajustado son las diferencias entre las respuestas observadas en cada combinación de valores de las variables explicativas y la predicción correspondiente de la respuesta calculada utilizando la función de regresión. Matemáticamente, la definición del residual para la i- ésima observación en el conjunto de datos se escribe
con y i denotando la i- ésima respuesta en el conjunto de datos y x i el vector de variables explicativas, cada conjunto en los valores correspondientes encontrados en la i- ésima observación en el conjunto de datos.
Si el ajuste del modelo a los datos fuera correcto, los residuales se aproximarían a los errores aleatorios que hacen que la relación entre las variables explicativas y la variable de respuesta sea una relación estadística. Por lo tanto, si los residuos parecen comportarse de manera aleatoria, sugiere que el modelo se ajusta bien a los datos. Por otro lado, si la estructura no aleatoria es evidente en los residuos, es una señal clara de que el modelo se ajusta mal a los datos. La siguiente sección detalla los tipos de parcelas que se utilizarán para probar diferentes aspectos de un modelo y brinda las interpretaciones correctas de los diferentes resultados que podrían observarse para cada tipo de parcela.
Análisis gráfico de residuos
Una forma básica, aunque no cuantitativamente precisa, de verificar los problemas que hacen que un modelo sea inadecuado es realizar un examen visual de los residuos (las predicciones erróneas de los datos utilizados para cuantificar el modelo) para buscar desviaciones obvias de la aleatoriedad. Si un examen visual sugiere, por ejemplo, la posible presencia de heterocedasticidad (una relación entre la varianza de los errores del modelo y el tamaño de las observaciones de una variable independiente), entonces se pueden realizar pruebas estadísticas para confirmar o rechazar esta corazonada; si se confirma, se requieren diferentes procedimientos de modelado.
Los diferentes tipos de gráficos de los residuos de un modelo ajustado proporcionan información sobre la idoneidad de los diferentes aspectos del modelo.
- suficiencia de la parte funcional del modelo: diagramas de dispersión de residuos versus predictores
- variación no constante a través de los datos: gráficos de dispersión de residuos versus predictores; para los datos recopilados a lo largo del tiempo, también gráficos de residuos contra el tiempo
- deriva en los errores (datos recopilados a lo largo del tiempo): ejecute gráficos de la respuesta y los errores en función del tiempo
- independencia de errores: gráfico de retardo
- normalidad de errores: histograma y gráfico de probabilidad normal
Los métodos gráficos tienen una ventaja sobre los métodos numéricos para la validación de modelos porque ilustran fácilmente una amplia gama de aspectos complejos de la relación entre el modelo y los datos.
Análisis cuantitativo de residuos
Los métodos numéricos también juegan un papel importante en la validación del modelo. Por ejemplo, la prueba de falta de ajuste para evaluar la exactitud de la parte funcional del modelo puede ayudar a interpretar un gráfico de residuales limítrofes. Una situación común en la que los métodos de validación numérica tienen prioridad sobre los métodos gráficos es cuando el número de parámetros que se estiman es relativamente cercano al tamaño del conjunto de datos. En esta situación, los gráficos de residuos son a menudo difíciles de interpretar debido a las limitaciones impuestas a los residuos por la estimación de los parámetros desconocidos. Un área en la que esto suele suceder es en las aplicaciones de optimización que utilizan experimentos diseñados . La regresión logística con datos binarios es otra área en la que el análisis gráfico de residuos puede resultar difícil.
La correlación en serie de los residuos puede indicar una especificación incorrecta del modelo y se puede verificar con la estadística de Durbin-Watson . El problema de la heterocedasticidad se puede comprobar de varias formas .
Evaluación fuera de muestra
La validación cruzada es el proceso de evaluar cómo los resultados de un análisis estadístico se generalizarán a un conjunto de datos independientes. Si el modelo se ha estimado sobre algunos, pero no todos, los datos disponibles, entonces el modelo que usa los parámetros estimados puede usarse para predecir los datos retenidos. Si, por ejemplo, el error cuadrático medio fuera de la muestra , también conocido como error de predicción cuadrático medio , es sustancialmente mayor que el error cuadrático medio dentro de la muestra, esto es un signo de deficiencia en el modelo.
Un avance en las estadísticas médicas es el uso de técnicas de validación cruzada fuera de la muestra en el metanálisis. Forma la base de la estadística de validación, Vn , que se utiliza para probar la validez estadística de las estimaciones resumidas del metanálisis. Esencialmente, mide un tipo de error de predicción normalizado y su distribución es una combinación lineal de χ 2 variables de grado 1. [1]
Ver también
Referencias
- ^ Willis BH, Riley RD (2017). "Medición de la validez estadística del resumen de los resultados del metanálisis y la metarregresión para su uso en la práctica clínica" . Estadística en Medicina . 36 (21): 3283–3301. doi : 10.1002 / sim.7372 . PMC 5575530 . PMID 28620945 .
Otras lecturas
- Arboretti Giancristofaro, R .; Salmaso, L. (2003), "Análisis del rendimiento del modelo y validación del modelo en regresión logística" , Statistica , 63 : 375–396
- Kmenta, Jan (1986), Elements of Econometrics (Segunda ed.), Macmillan, págs. 593-600; republicado en 1997 por University of Michigan Press
enlaces externos
- ¿Cómo puedo saber si un modelo se ajusta a mis datos? (NIST)
- Manual electrónico de métodos estadísticos de NIST / SEMATECH
- Model Diagnostics ( Eberly College of Science )
Este artículo incorpora material de dominio público del sitio web del Instituto Nacional de Estándares y Tecnología https://www.nist.gov .