Selección de modelo


La selección de modelos es la tarea de seleccionar un modelo estadístico de un conjunto de modelos candidatos, dados los datos. En los casos más simples, se considera un conjunto de datos preexistente. Sin embargo, la tarea también puede implicar el diseño de experimentos de modo que los datos recopilados se adapten bien al problema de la selección del modelo. Dados los modelos candidatos con un poder predictivo o explicativo similar, es más probable que el modelo más simple sea la mejor opción ( la navaja de Occam ).

Konishi & Kitagawa (2008 , p. 75) afirman: "La mayoría de los problemas de inferencia estadística pueden considerarse problemas relacionados con el modelado estadístico". En relación con esto, Cox (2006 , p. 197) ha dicho: "La forma en que [la] traducción del problema de la materia en cuestión se realiza a un modelo estadístico es a menudo la parte más crítica de un análisis".

La selección de modelos también puede referirse al problema de seleccionar unos pocos modelos representativos de un gran conjunto de modelos computacionales con el propósito de tomar decisiones u optimizar bajo incertidumbre. [1]

En sus formas más básicas, la selección de modelos es una de las tareas fundamentales de la investigación científica . Determinar el principio que explica una serie de observaciones a menudo está directamente relacionado con un modelo matemático que predice esas observaciones. Por ejemplo, cuando Galileo realizó sus experimentos con el plano inclinado , demostró que el movimiento de las bolas se ajustaba a la parábola predicha por su modelo [ cita requerida ] .

De la innumerable cantidad de posibles mecanismos y procesos que podrían haber producido los datos, ¿cómo se puede comenzar a elegir el mejor modelo? El enfoque matemático comúnmente adoptado decide entre un conjunto de modelos candidatos; este conjunto debe ser elegido por el investigador. A menudo, se utilizan modelos simples como los polinomios , al menos inicialmente [ cita requerida ] . Burnham y Anderson (2002) enfatizan a lo largo de su libro la importancia de elegir modelos basados ​​en principios científicos sólidos, como la comprensión de los procesos o mecanismos fenomenológicos (p. ej., reacciones químicas) subyacentes a los datos.

Una vez elegido el conjunto de modelos candidatos, el análisis estadístico nos permite seleccionar el mejor de estos modelos. Lo que se entiende por mejor es controvertido. Una buena técnica de selección de modelos equilibrará la bondad del ajuste con la simplicidad [ cita requerida ] . Los modelos más complejos podrán adaptar mejor su forma para ajustarse a los datos (por ejemplo, un polinomio de quinto orden puede ajustarse exactamente a seis puntos), pero es posible que los parámetros adicionales no representen nada útil. (Quizás esos seis puntos en realidad están distribuidos aleatoriamente alrededor de una línea recta). La bondad del ajuste generalmente se determina utilizando un enfoque de razón de verosimilitud , o una aproximación de esto, lo que lleva a una prueba de chi-cuadrado.. La complejidad generalmente se mide contando el número de parámetros en el modelo.


El ciclo de la observación científica.