Modelo caja gris

En matemáticas , estadística y modelado computacional , un modelo de caja gris ^[1]^[2]^[3]^[4] combina una estructura teórica parcial con datos para completar el modelo. La estructura teórica puede variar desde información sobre la fluidez de los resultados hasta modelos que solo necesitan valores de parámetros de datos o literatura existente. ^[5] Por lo tanto, casi todos los modelos son modelos de caja gris en contraposición a la caja negra donde no se asume ninguna forma de modelo o modelos de caja blanca que son puramente teóricos. Algunos modelos asumen una forma especial, como una regresión lineal ^[6]^[7] ored neuronal . ^[8]^[9] Estos tienen métodos de análisis especiales. En particular, las técnicas de regresión lineal ^[10] son mucho más eficientes que la mayoría de las técnicas no lineales. ^[11]^[12] El modelo puede ser determinista o estocástico (es decir, que contiene componentes aleatorios) dependiendo de su uso planificado.

Formulario modelo

El caso general es un modelo no lineal con una estructura teórica parcial y algunas partes desconocidas derivadas de los datos. Los modelos con estructuras teóricas diferentes necesitan ser evaluados individualmente, ^[1]^[13]^[14] posiblemente usando annealing simulado o algoritmos genéticos .

Dentro de una estructura de modelo particular, es posible que sea necesario encontrar parámetros ^[14]^[15] o relaciones de parámetros variables ^[5]^[16] . Para una estructura particular, se supone arbitrariamente que los datos consisten en conjuntos de vectores de alimentación f , vectores de producto p y vectores de condición operativa c . ^[5] Normalmente, c contendrá valores extraídos de f , así como otros valores. En muchos casos, un modelo se puede convertir a una función de la forma: ^[5]^[17]^[18]

m (f, p, q)

donde la función vectorial m da los errores entre los datos p y las predicciones del modelo. El vector q da algunos parámetros variables que son partes desconocidas del modelo.

Los parámetros q varían con las condiciones de funcionamiento c de una manera por determinar. ^[5]^[17] Esta relación se puede especificar como q = Ac donde A es una matriz de coeficientes desconocidos, yc como en la regresión lineal ^[6]^[7] incluye un término constante y posiblemente valores transformados de las condiciones de operación originales para obtener relaciones no lineales ^[19]^[20] entre las condiciones de funcionamiento originales y q . Entonces se trata de seleccionar qué términos en A son distintos de cero y asignar sus valores. La finalización del modelo se convierte en un problema de optimización para determinar los valores distintos de cero en A que minimiza los términos de error m (f, p, Ac) sobre los datos. ^[1]^[16]^[21]^[22]^[23]

Finalización del modelo

Una vez que se realiza una selección de valores distintos de cero, los coeficientes restantes en A se pueden determinar minimizando m ( f , p , Ac ) sobre los datos con respecto a los valores distintos de cero en A , típicamente por mínimos cuadrados no lineales . La selección de términos distintos de cero se puede realizar mediante métodos de optimización como el recocido simulado y los algoritmos evolutivos . Además, los mínimos cuadrados no lineales pueden proporcionar estimaciones de precisión ^[11]^[15] para los elementos de A que pueden usarse para determinar si son significativamente diferentes de cero, proporcionando así un método de selección de términos . ^[24]^[25]

A veces es posible calcular valores de q para cada conjunto de datos, directamente o por mínimos cuadrados no lineales . Entonces, la regresión lineal más eficiente puede usarse para predecir q usando c , seleccionando así los valores distintos de cero en A y estimando sus valores. Una vez que se encuentran los valores distintos de cero, los mínimos cuadrados no lineales se pueden usar en el modelo original m (f, p, Ac) para refinar estos valores. ^[16]^[21]^[22]

Un tercer método es la inversión del modelo , ^[5]^[17]^[18] que convierte el m ( f , p , Ac ) no lineal en una forma lineal aproximada en los elementos de A , que puede examinarse mediante una selección de términos eficiente ^{[ 24]}^[25] y evaluación de la regresión lineal. ^[10] Para el caso simple de un solo valor q ( q = a ^Tc ) y una estimación q * de q . Poniendo d q = a ^Tc - q * da

m (f, p, una ^Tc) = m (f, p, q * + d q) ≈ m (f, pq *) + d q m '(f, p, q *) = m (f, pq *) + (una ^Tc - q *) m '(f, p, q *)

de modo que una ^T está ahora en una posición lineal con todos los demás términos conocidos y, por lo tanto, puede analizarse mediante técnicas de regresión lineal . Para más de un parámetro, el método se extiende de manera directa. ^[5]^[18]^[17] Después de comprobar que el modelo ha sido mejorado, este proceso se puede repetir hasta la convergencia. Este enfoque tiene las ventajas de que no necesita los parámetros q para poder ser determinado a partir de un conjunto de datos individual y la regresión lineal se basa en los términos de error originales ^[5]

Modelo de validación

Cuando se dispone de datos suficientes, se recomienda la división de los datos en un conjunto de construcción de modelos separado y uno o dos conjuntos de evaluación . Esto se puede repetir usando múltiples selecciones del conjunto de construcción y los modelos resultantes promediados o usados para evaluar las diferencias de predicción.

Una prueba estadística como chi-cuadrado en los residuos no es particularmente útil. ^[26] La prueba de chi cuadrado requiere desviaciones estándar conocidas que rara vez están disponibles, y las pruebas fallidas no dan ninguna indicación de cómo mejorar el modelo. ^[11] Existe una variedad de métodos para comparar modelos anidados y no anidados. Estos incluyen la comparación de las predicciones del modelo con datos repetidos.

Un intento de predecir los residuos m (,) con las condiciones de operación c usando regresión lineal mostrará si los residuos pueden predecirse. ^[21]^{[22] Los} residuos que no se pueden predecir ofrecen pocas posibilidades de mejorar el modelo utilizando las condiciones operativas actuales. ^{[5] Los} términos que predicen los residuales son términos prospectivos para incorporar en el modelo para mejorar su desempeño. ^[21]

La técnica de inversión de modelo anterior se puede utilizar como método para determinar si un modelo se puede mejorar. En este caso, la selección de términos distintos de cero no es tan importante y la predicción lineal se puede hacer utilizando los vectores propios significativos de la matriz de regresión . Los valores de A determinados de esta manera deben sustituirse en el modelo no lineal para evaluar las mejoras en los errores del modelo. La ausencia de una mejora significativa indica que los datos disponibles no pueden mejorar la forma del modelo actual utilizando los parámetros definidos. ^[5] Se pueden insertar parámetros adicionales en el modelo para hacer esta prueba más completa.

Ver también

Experimento informático
Simulación por ordenador
Diseño de experimentos
Prueba de caja gris
Modelo matemático
Identificación del sistema no lineal
Estimación de parámetros
Diseño de la investigación
Modelado científico
Simulación
Modelo estadístico
Sistemas dinámicos
Identificación del sistema
Realización del sistema
Teoría de sistemas

Referencias

↑ a b c Bohlin, Torsten P. (7 de septiembre de 2006). Identificación práctica de procesos de caja gris: teoría y aplicaciones . Springer Science & Business Media. ISBN 978-1-84628-403-8.
^ "Estimación del modelo de caja gris" . Mathworks 2. 2012.
^ Kroll, Andreas (2000). Modelos de caja gris: conceptos y aplicación. En: Nuevas fronteras en inteligencia computacional y sus aplicaciones, vol.57 de Fronteras en inteligencia artificial y aplicaciones, pp. 42-51. IOS Press, Amsterdam.
^ Sohlberg, B. y Jacobsen, EW, 2008. Modelado de caja gris: ramas y experiencias , Proc. XVII Congreso Mundial, Int. Federación de Control Automático, Seúl. págs. 11415-11420
^ a b c d e f g h i j Whiten, B., 2013. Finalización y validación de modelos mediante la inversión de modelos de caja gris , ANZIAM J., 54 (CTAC 2012) pp C187 – C199.
^ a b Draper, Norman R .; Smith, Harry (25 de agosto de 2014). Análisis de regresión aplicado . John Wiley e hijos. págs. 657–. ISBN 978-1-118-62568-2.
^ a b Weisberg, Sanford (25 de noviembre de 2013). Regresión lineal aplicada . Wiley. ISBN 978-1-118-59485-8.
^ Heaton, J., 2012. Introducción a las matemáticas de las redes neuronales, Heaton Research Inc. (Chesterfield, MO), ISBN 978-1475190878
^ Stergiou, C .; Siganos, D. (2013). "Redes neuronales" . Archivado desde el original el 16 de diciembre de 2009 . Consultado el 3 de julio de 2013 .
^ a b Lawson, Charles L .; J. Hanson, Richard (1 de diciembre de 1995). Resolver problemas de mínimos cuadrados . SIAM. ISBN 978-0-89871-356-5.
^ a b c Presione, WH; Teukolsky, SA; Vetterling, WT; Flannery, BP (2007). Recetas numéricas (3ª ed.). Prensa de la Universidad de Cambridge. ISBN 978-0-521-88068-8.
^ Gelman, Andrew; Carlin, John B .; Stern, Hal S .; Dunson, David B .; Vehtari, Aki; Rubin, Donald B. (1 de noviembre de 2013). Análisis de datos bayesianos, tercera edición . Prensa CRC. ISBN 978-1-4398-4095-5.
^ Mathworks, 2013. Modelos de caja gris compatibles
^ a b Hauth, J. (2008), Modelado de caja gris para sistemas no lineales (PDF) (disertación, Universidad Tecnológica de Kaiserslautern ).
^ a b Nash, JC y Walker-Smith, M. 1987. Estimación de parámetros no lineales, Marcel Dekker, Inc. (Nueva York).
^ a b c Whiten, WJ, 1971. Técnicas de construcción de modelos aplicadas a procesos de tratamiento de minerales, Symp. sobre sistemas de control automático en plantas de procesamiento de minerales, (Australas. Inst. Min. Metall., S. Queensland Branch, Brisbane), 129-148.
^ a b c d Whiten, WJ, 1994. Determinación de relaciones de parámetros dentro de modelos no lineales, SIGNUM Newsletter, 29 (3-4,) 2-5. 10.1145 / 192527.192535.
^ a b c Whiten, B., 2014. Determinación de la forma de ecuaciones diferenciales ordinarias mediante la inversión del modelo , ANZIAM J. 55 (EMAC2013) pp.C329 – C347.
^ Polinomio
^ Spline (matemáticas)
^ a b c d Kojovic, T. y Whiten WJ, 1994. Evaluación de la calidad de los modelos de simulación, Innovaciones en el procesamiento de minerales, (Universidad Lauretian, Sudbury) págs. 437–446. ISBN 088667025X
^ a b c Kojovic, T., 1989. El desarrollo y la aplicación de Model: un constructor de modelos automatizado para el procesamiento de minerales, tesis doctoral, Universidad de Queensland.
^ Xiao, J., 1998. Extensiones de técnicas de construcción de modelos y sus aplicaciones en el procesamiento de minerales, tesis doctoral, Universidad de Queensland.
^ a b Linhart, H .; Calabacín, W. (1986). Selección de modelo . Wiley. ISBN 978-0-471-83722-0.
^ a b Miller, Alan (15 de abril de 2002). Selección de subconjuntos en regresión . Prensa CRC. ISBN 978-1-4200-3593-3.
^ Deming, William Edwards (2000). Fuera de la crisis p272 . Prensa del MIT. ISBN 978-0-262-54115-2.

[Bohlin06-1] Bohlin, Torsten P. (7 de septiembre de 2006). Identificación práctica de procesos de caja gris: teoría y aplicaciones . Springer Science & Business Media. ISBN 978-1-84628-403-8.

[Mathworks12-2] "Estimación del modelo de caja gris" . Mathworks 2. 2012.

[3] Kroll, Andreas (2000). Modelos de caja gris: conceptos y aplicación. En: Nuevas fronteras en inteligencia computacional y sus aplicaciones, vol.57 de Fronteras en inteligencia artificial y aplicaciones, pp. 42-51. IOS Press, Amsterdam.

[Sohlberg08-4] Sohlberg, B. y Jacobsen, EW, 2008. Modelado de caja gris: ramas y experiencias , Proc. XVII Congreso Mundial, Int. Federación de Control Automático, Seúl. págs. 11415-11420

[Whiten13-5] ^ a b c d e f g h i j Whiten, B., 2013. Finalización y validación de modelos mediante la inversión de modelos de caja gris , ANZIAM J., 54 (CTAC 2012) pp C187 – C199.

[Draper98-6] Draper, Norman R .; Smith, Harry (25 de agosto de 2014). Análisis de regresión aplicado . John Wiley e hijos. págs. 657–. ISBN 978-1-118-62568-2.

[Weisburg05-7] Weisberg, Sanford (25 de noviembre de 2013). Regresión lineal aplicada . Wiley. ISBN 978-1-118-59485-8.

[Heaton12-8] Heaton, J., 2012. Introducción a las matemáticas de las redes neuronales, Heaton Research Inc. (Chesterfield, MO), ISBN 978-1475190878

[Stergiou13-9] Stergiou, C .; Siganos, D. (2013). "Redes neuronales" . Archivado desde el original el 16 de diciembre de 2009 . Consultado el 3 de julio de 2013 .

[Lawson96-10] Lawson, Charles L .; J. Hanson, Richard (1 de diciembre de 1995). Resolver problemas de mínimos cuadrados . SIAM. ISBN 978-0-89871-356-5.

[Press07-11] Presione, WH; Teukolsky, SA; Vetterling, WT; Flannery, BP (2007). Recetas numéricas (3ª ed.). Prensa de la Universidad de Cambridge. ISBN 978-0-521-88068-8.

[Gelman03-12] Gelman, Andrew; Carlin, John B .; Stern, Hal S .; Dunson, David B .; Vehtari, Aki; Rubin, Donald B. (1 de noviembre de 2013). Análisis de datos bayesianos, tercera edición . Prensa CRC. ISBN 978-1-4398-4095-5.

[Mathworks13-13] Mathworks, 2013. Modelos de caja gris compatibles

[Hauth08-14] Hauth, J. (2008), Modelado de caja gris para sistemas no lineales (PDF) (disertación, Universidad Tecnológica de Kaiserslautern ).

[Nash87-15] Nash, JC y Walker-Smith, M. 1987. Estimación de parámetros no lineales, Marcel Dekker, Inc. (Nueva York).

[Whiten71-16] Whiten, WJ, 1971. Técnicas de construcción de modelos aplicadas a procesos de tratamiento de minerales, Symp. sobre sistemas de control automático en plantas de procesamiento de minerales, (Australas. Inst. Min. Metall., S. Queensland Branch, Brisbane), 129-148.

[Whiten94-17] Whiten, WJ, 1994. Determinación de relaciones de parámetros dentro de modelos no lineales, SIGNUM Newsletter, 29 (3-4,) 2-5. 10.1145 / 192527.192535.

[Whiten14-18] Whiten, B., 2014. Determinación de la forma de ecuaciones diferenciales ordinarias mediante la inversión del modelo , ANZIAM J. 55 (EMAC2013) pp.C329 – C347.

[Wikipolynomial-19] Polinomio

[Wikispline-20] Spline (matemáticas)

[Kojovic94-21] Kojovic, T. y Whiten WJ, 1994. Evaluación de la calidad de los modelos de simulación, Innovaciones en el procesamiento de minerales, (Universidad Lauretian, Sudbury) págs. 437–446. ISBN 088667025X

[Kojovic89-22] Kojovic, T., 1989. El desarrollo y la aplicación de Model: un constructor de modelos automatizado para el procesamiento de minerales, tesis doctoral, Universidad de Queensland.

[Xiao98-23] Xiao, J., 1998. Extensiones de técnicas de construcción de modelos y sus aplicaciones en el procesamiento de minerales, tesis doctoral, Universidad de Queensland.

[Linhart86-24] Linhart, H .; Calabacín, W. (1986). Selección de modelo . Wiley. ISBN 978-0-471-83722-0.

[Miller02-25] Miller, Alan (15 de abril de 2002). Selección de subconjuntos en regresión . Prensa CRC. ISBN 978-1-4200-3593-3.

[Deming2000-26] Deming, William Edwards (2000). Fuera de la crisis p272 . Prensa del MIT. ISBN 978-0-262-54115-2.

[1]