Modelo caja gris


En matemáticas , estadística y modelado computacional , un modelo de caja gris [1] [2] [3] [4] combina una estructura teórica parcial con datos para completar el modelo. La estructura teórica puede variar desde información sobre la fluidez de los resultados hasta modelos que solo necesitan valores de parámetros de los datos o la literatura existente. [5] Por lo tanto, casi todos los modelos son modelos de caja gris a diferencia de los de caja negra donde no se asume ninguna forma de modelo o modelos de caja blanca que son puramente teóricos. Algunos modelos asumen una forma especial, como una regresión lineal [6] [7] ored neuronal . [8] [9] Estos tienen métodos de análisis especiales. En particular, las técnicas de regresión lineal [10] son mucho más eficientes que la mayoría de las técnicas no lineales. [11] [12] El modelo puede ser determinista o estocástico (es decir, que contiene componentes aleatorios) dependiendo de su uso planificado.

El caso general es un modelo no lineal con una estructura teórica parcial y algunas partes desconocidas derivadas de los datos. Los modelos con estructuras teóricas diferentes necesitan ser evaluados individualmente, [1] [13] [14] posiblemente usando annealing simulado o algoritmos genéticos .

Dentro de una estructura de modelo particular, es posible que sea necesario encontrar parámetros [14] [15] o relaciones de parámetros variables [5] [16] . Para una estructura particular, se supone arbitrariamente que los datos consisten en conjuntos de vectores de alimentación f , vectores de producto p y vectores de condición operativa c . [5] Normalmente, c contendrá valores extraídos de f , así como otros valores. En muchos casos, un modelo se puede convertir a una función de la forma: [5] [17] [18]

donde la función vectorial m da los errores entre los datos p y las predicciones del modelo. El vector q da algunos parámetros variables que son partes desconocidas del modelo.

Los parámetros q varían con las condiciones de funcionamiento c de una manera por determinar. [5] [17] Esta relación se puede especificar como q = Ac donde A es una matriz de coeficientes desconocidos, yc como en la regresión lineal [6] [7] incluye un término constante y posiblemente valores transformados de las condiciones de operación originales para obtener relaciones no lineales [19] [20] entre las condiciones de funcionamiento originales y q . Entonces es una cuestión de seleccionar qué términos en Ason distintos de cero y asignan sus valores. La finalización del modelo se convierte en un problema de optimización para determinar los valores distintos de cero en A que minimiza los términos de error m (f, p, Ac) sobre los datos. [1] [16] [21] [22] [23]

Una vez que se realiza una selección de valores distintos de cero, los coeficientes restantes en A se pueden determinar minimizando m ( f , p , Ac ) sobre los datos con respecto a los valores distintos de cero en A , típicamente por mínimos cuadrados no lineales . La selección de términos distintos de cero se puede realizar mediante métodos de optimización como el recocido simulado y los algoritmos evolutivos . Además, los mínimos cuadrados no lineales pueden proporcionar estimaciones de precisión [11] [15] para los elementos de Aque se puede utilizar para determinar si son significativamente diferentes de cero, proporcionando así un método de selección de términos . [24] [25]