Kriging mejorado con degradado

El kriging mejorado con gradiente ( GEK ) es una técnica de modelado sustituto utilizada en ingeniería. Un modelo sustituto (conocido alternativamente como metamodelo , superficie de respuesta o emulador) es una predicción de la salida de un costoso código informático. ^[1] Esta predicción se basa en un pequeño número de evaluaciones del costoso código informático.

Introducción

Ejemplo de datos unidimensionales interpolados por Kriging y GEK. La línea negra indica la función de prueba, mientras que los círculos grises indican 'observaciones', 'muestras' o 'evaluaciones' de la función de prueba. La línea azul es la media de Kriging, el área sombreada en azul ilustra la desviación estándar de Kriging. Con GEK podemos agregar la información del gradiente, ilustrada en rojo, lo que aumenta la precisión de la predicción.

Solucionadores ADJOINT se están convirtiendo disponible en una gama de dinámica de fluidos computacional solucionadores (CFD), tales como Fluido , OpenFOAM , SU2 y US3D. Desarrollados originalmente para la optimización , los solucionadores adjuntos ahora encuentran cada vez más uso en la cuantificación de la incertidumbre .

Aceleración lineal

Un solucionador adjunto permite calcular el gradiente de la cantidad de interés con respecto a todos los parámetros de diseño al costo de una solución adicional. Esto, potencialmente, conduce a una aceleración lineal : el costo computacional de construir una disminución sustituta precisa y la aceleración computacional resultante. ${\ Displaystyle s}$ escala linealmente con el número ${\ Displaystyle d}$ de los parámetros de diseño.

El razonamiento detrás de esta aceleración lineal es sencillo. Supongamos que corremos ${\ Displaystyle N}$ primal resuelve y ${\ Displaystyle N}$ adjunto resuelve, a un costo total de ${\ Displaystyle 2N}$ . Esto resulta en ${\ Displaystyle N + dN}$ datos; ${\ Displaystyle N}$ valores para la cantidad de interés y ${\ Displaystyle d}$ derivadas parciales en cada una de las ${\ Displaystyle N}$ gradientes. Ahora suponga que cada derivada parcial proporciona tanta información para nuestro sustituto como una única solución primaria. Entonces, el costo total de obtener la misma cantidad de información solo de las soluciones primarias es ${\ Displaystyle N + dN}$ . La aceleración es la proporción de estos costos: ^[2]^[3]

{\ Displaystyle s = {\ frac {N + dN} {2N}} = {\ frac {1} {2}} + {\ frac {1} {2}} d.}

Se ha demostrado una aceleración lineal para un problema de interacción fluido-estructura ^[2] y para un perfil aerodinámico transónico . ^[3]

Ruido

Un problema con los gradientes basados en adjuntos en CFD es que pueden ser particularmente ruidosos . ^[4]^[5] Cuando se deriva en un marco bayesiano , GEK permite incorporar no solo la información de gradiente, sino también la incertidumbre en esa información de gradiente. ^[6]

Acercarse

Cuando se usa GEK, se siguen los siguientes pasos:

Crear un diseño de experimento (DoE): El DoE o 'plan de muestreo' es una lista de diferentes ubicaciones en el espacio de diseño. El DoE indica qué combinaciones de parámetros se usarán para muestrear la simulación por computadora. Con Kriging y GEK, una opción común es utilizar un diseño de diseño de hipercubo latino (LHS) con un criterio de 'maximin'. El diseño LHS está disponible en códigos de secuencias de comandos como MATLAB o Python .
Haga observaciones: para cada muestra en nuestro DoE, se ejecuta la simulación por computadora para obtener la Cantidad de interés (QoI).
Construya el sustituto: se utilizan las ecuaciones del predictor GEK para construir el sustituto condicional de las observaciones obtenidas.

Una vez que se ha construido el sustituto, se puede utilizar de diferentes formas, por ejemplo, para la cuantificación de la incertidumbre (UQ) u optimización basada en sustitutos .

Ecuaciones predictoras

En un marco bayesiano , utilizamos el teorema de Bayes para predecir la media de Kriging y la covarianza condicionada a las observaciones. Cuando se utiliza GEK, las observaciones suelen ser el resultado de una serie de simulaciones por ordenador. GEK se puede interpretar como una forma de regresión del proceso gaussiano .

Kriging

En la línea de, ^[7] estamos interesados en el resultado ${\ Displaystyle X}$ de nuestra simulación por computadora, para la cual asumimos la distribución de probabilidad previa normal :

{\ Displaystyle X \ sim {\ mathcal {N}} (\ mu, P),}

con media previa ${\ Displaystyle \ mu}$ y matriz de covarianza previa ${\ Displaystyle P}$ . Las observaciones ${\ Displaystyle y}$ tienen la probabilidad normal :

{\ Displaystyle Y \ mid x \ sim {\ mathcal {N}} (Hx, R),}

con ${\ Displaystyle H}$ la matriz de observación y ${\ Displaystyle R}$ la matriz de covarianza del error de observación, que contiene las incertidumbres de observación . Después de aplicar el teorema de Bayes obtenemos una distribución de probabilidad posterior normalmente distribuida , con media de Kriging:

{\ Displaystyle \ operatorname {E} (X \ mid y) = \ mu + K (yH \ mu),}

y covarianza de Kriging:

{\ Displaystyle \ operatorname {cov} (X \ mid y) = (I-KH) P,}

donde tenemos la matriz de ganancia:

{\ Displaystyle K = PH ^ {T} (R + HPH ^ {T}) ^ {- 1}.}

En Kriging, la matriz de covarianza previa ${\ Displaystyle P}$ se genera a partir de una función de covarianza. Un ejemplo de función de covarianza es la covarianza gaussiana:

{\ Displaystyle P_ {ij} = \ sigma ^ {2} \ exp \ left (- \ sum _ {k} {\ frac {| \ xi _ {jk} - \ xi _ {ik} | ^ {2}} {2 \ theta _ {k} ^ {2}}} \ right),}

donde sumamos las dimensiones ${\ Displaystyle k}$ y ${\ Displaystyle \ xi}$ son los parámetros de entrada. Los hiperparámetros ${\ Displaystyle \ mu}$ , ${\ Displaystyle \ sigma}$ y ${\ Displaystyle \ theta}$ se puede estimar a partir de una estimación de máxima verosimilitud (MLE). ^[6]^[8]

GEK indirecto

Hay varias formas de implementar GEK. El primer método, GEK indirecto, define un tamaño de paso pequeño pero finito ${\ Displaystyle h}$ y utiliza la información del gradiente para agregar datos sintéticos a las observaciones. ${\ Displaystyle y}$ , ver por ejemplo. ^[8] Kriging indirecto es sensible a la elección del tamaño del paso ${\ Displaystyle h}$ y no puede incluir incertidumbres de observación .

GEK directo (a través de matriz de covarianza previa)

Direct GEK es una forma de co-Kriging, donde agregamos la información del gradiente como covariables. Esto se puede hacer modificando la covarianza previa. ${\ Displaystyle P}$ o modificando la matriz de observación ${\ Displaystyle H}$ ; ambos enfoques conducen al mismo predictor GEK. Cuando construimos GEK directo a través de la matriz de covarianza anterior, agregamos las derivadas parciales a ${\ Displaystyle y}$ y modificar la matriz de covarianza previa ${\ Displaystyle P}$ de manera que también contiene las derivadas (y segundas derivadas) de la función de covarianza, ver por ejemplo ^[9] . ^[6] Las principales ventajas de GEK directo sobre GEK indirecto son: 1) no tenemos que elegir un tamaño de paso, 2) podemos incluir incertidumbres de observación para los gradientes en ${\ Displaystyle R}$ y 3) es menos susceptible a un mal acondicionamiento de la matriz de ganancia ${\ Displaystyle K}$ . ^[6]^[8]

GEK directo (mediante matriz de observación)

Otra forma de llegar al mismo predictor directo de GEK es agregar las derivadas parciales a las observaciones ${\ Displaystyle y}$ e incluir operadores de derivadas parciales en la matriz de observación ${\ Displaystyle H}$ , ver por ejemplo. ^[10]

Kriging mejorado con gradiente para problemas de alta dimensión (método indirecto)

Los métodos de kriging mejorados por gradiente actuales no se adaptan bien al número de puntos de muestreo debido al rápido crecimiento en el tamaño de la matriz de correlación, donde se agrega nueva información para cada punto de muestreo en cada dirección del espacio de diseño. Además, no escalan bien con el número de variables independientes debido al aumento en el número de hiperparámetros que deben estimarse. Para abordar este problema, se desarrolla un nuevo enfoque de modelo sustituto mejorado con gradiente que redujo drásticamente el número de hiperparámetros mediante el uso del método de mínimos cuadrados parciales que mantiene la precisión. Además, este método es capaz de controlar el tamaño de la matriz de correlación agregando solo los puntos relevantes definidos a través de la información proporcionada por el método de mínimos cuadrados parciales. Para obtener más detalles, consulte. ^[11] Este enfoque se implementa en Surrogate Modeling Toolbox (SMT) en Python ( https://github.com/SMTorg/SMT ) y se ejecuta en Linux, macOS y Windows. SMT se distribuye bajo la nueva licencia BSD.

Ejemplo: coeficiente de arrastre de un perfil aerodinámico transónico

Perfil aerodinámico transónico.

Resultados de referencia para el coeficiente de resistencia aerodinámica de una superficie aerodinámica transónica, basados en una gran cantidad de simulaciones CFD. Los ejes horizontal y vertical muestran la deformación de la forma del perfil aerodinámico.

Modelo sustituto de Kriging del coeficiente de resistencia aerodinámica de un perfil aerodinámico transónico. Los puntos grises indican las configuraciones para las que se ejecutó el solucionador de CFD.

Modelo sustituto GEK del coeficiente de arrastre de un perfil aerodinámico transónico. Los puntos grises indican las configuraciones para las que se ejecutó el solucionador de CFD, las flechas indican los gradientes.

Como ejemplo, considere el flujo sobre un perfil aerodinámico transónico . ^[3] La superficie aerodinámica está funcionando a un número de Mach de 0,8 y un ángulo de ataque de 1,25 grados. Suponemos que la forma del perfil aerodinámico es incierta; la parte superior e inferior del perfil aerodinámico pueden haberse movido hacia arriba o hacia abajo debido a las tolerancias de fabricación. En otras palabras, la forma del perfil aerodinámico que estamos usando puede ser ligeramente diferente del perfil aerodinámico que diseñamos.

A la derecha vemos los resultados de referencia para el coeficiente de resistencia aerodinámica del perfil aerodinámico, basados en una gran cantidad de simulaciones CFD. Tenga en cuenta que la resistencia más baja, que corresponde a un rendimiento "óptimo", está cerca del diseño de "línea de base" no deformado del perfil aerodinámico en (0,0).

Después de diseñar un plan de muestreo (indicado por los puntos grises) y ejecutar el solucionador de CFD en esas ubicaciones de muestra, obtenemos el modelo sustituto de Kriging. El sustituto de Kriging está cerca de la referencia, pero quizás no tanto como desearíamos.

En la última figura, hemos mejorado la precisión de este modelo sustituto al incluir la información de gradiente basada en adjuntos, indicada por las flechas, y aplicar GEK.

Aplicaciones

GEK ha encontrado las siguientes aplicaciones:

1993: Problema de diseño para una función de prueba de modelo de pozo. ^[12]
2002: Diseño aerodinámico de un jet ejecutivo supersónico. ^[13]
2008: Cuantificación de la incertidumbre para un perfil aerodinámico transónico con parámetros de forma inciertos. ^[9]
2009: cuantificación de la incertidumbre para un perfil aerodinámico transónico con parámetros de forma inciertos. ^[8]
2012: Construcción de modelo sustituto para un problema de divergencia de paneles, un problema de interacción fluido-estructura . Demostración de una aceleración lineal. ^[2]
2013: Cuantificación de la incertidumbre para un perfil aerodinámico transónico con ángulo de ataque incierto y número de Mach. ^[14]
2014: Cuantificación de la incertidumbre para la simulación RANS de un perfil aerodinámico, con los parámetros del modelo de turbulencia k-épsilon como entradas inciertas. ^[6]
2015: Cuantificación de la incertidumbre para la simulación de Euler de un perfil aerodinámico transónico con parámetros de forma inciertos. Demostración de una aceleración lineal. ^[3]
2016: Construcción de modelos sustitutos para dos problemas de interacción fluido-estructura . ^[15]
2017: Amplia revisión de los modelos sustitutos mejorados con gradiente que incluyen muchos detalles sobre el kriging mejorado con gradiente. ^[dieciséis]
2017: Propagación de la incertidumbre para un sistema de energía nuclear. ^[17]
2020: Optimización de la geometría molecular. ^[18]

Referencias

↑ Mitchell, M .; Morris, M. (1992). "Diseño y análisis bayesiano de experimentos informáticos: dos ejemplos" (PDF) . Statistica Sinica (2): 359–379.
^ a b c de Baar, JHS; Scholcz, TP; Verhoosel, CV; Dwight, RP; van Zuijlen, AH; Bijl, H. (2012). "Cuantificación eficiente de la incertidumbre con Kriging mejorado con gradiente: aplicaciones en FSI" (PDF) . ECCOMAS, Viena, Austria, 10 al 14 de septiembre .
^ a b c d de Baar, JHS; Scholcz, TP; Dwight, RP (2015). "Explotación de derivados adjuntos en metamodelos de alta dimensión". Revista AIAA . 53 (5): 1391-1395. Código bibliográfico : 2015AIAAJ..53.1391D . doi : 10.2514 / 1.J053678 .
^ Dwight, R .; Brezillon, J. (2006). "Efecto de las aproximaciones del adjunto discreto en la optimización basada en gradientes". Revista AIAA . 44 (12): 3022-3031. Código bibliográfico : 2006AIAAJ..44.3022D . CiteSeerX 10.1.1.711.4761 . doi : 10,2514 / 1,21744 .
^ Giles, M .; Duta, M .; Muller, J .; Pierce, N. (2003). "Desarrollos de algoritmos para métodos adjuntos discretos" . Revista AIAA . 41 (2): 198-205. Código bibliográfico : 2003AIAAJ..41..198G . doi : 10,2514 / 2,1961 . S2CID 2106397 .
^ a b c d e de Baar, JHS; Dwight, RP; Bijl, H. (2014). "Mejoras en Kriging mejorado con gradiente utilizando una interpretación bayesiana". Revista internacional de cuantificación de la incertidumbre . 4 (3): 205–223. doi : 10.1615 / Int.J.UncertaintyQuantification.2013006809 .
^ Wikle, CK; Berliner, LM (2007). "Un tutorial bayesiano para la asimilación de datos". Physica D . 230 (1–2): 1–16. Código bibliográfico : 2007PhyD..230 .... 1W . doi : 10.1016 / j.physd.2006.09.017 .
^ a b c d Dwight, RP; Han, Z.-H. (2009). Cuantificación eficiente de la incertidumbre mediante Kriging mejorado con gradiente (PDF) . XI Conferencia de enfoques no deterministas de la AIAA, Palm Springs, California, 4 a 7 de mayo . doi : 10.2514 / 6.2009-2276 . ISBN 978-1-60086-975-4.
^ a b Laurenceau, J .; Sagaut, P. (2008). "Construyendo superficies de respuesta eficientes de funciones aerodinámicas con Kriging y coKriging". Revista AIAA . 46 (2): 498–507. Código bibliográfico : 2008AIAAJ..46..498L . doi : 10,2514 / 1,32308 . S2CID 17895486 .
^ de Baar, JHS (2014). "Sustitutos estocásticos para medidas y modelos informáticos de fluidos" . Tesis de doctorado, Universidad Tecnológica de Delft : 99–101.
^ Bouhlel, MA; Martins, JRRA (2018). "Kriging mejorado con gradiente para problemas de alta dimensión". Ingeniería con Computadoras . 35 : 157-173. arXiv : 1708.02663 . doi : 10.1007 / s00366-018-0590-x .
^ Morris, MD; Mitchell, TJ; Ylvisaker, D. (1993). "Diseño y análisis bayesiano de experimentos informáticos: uso de derivados en la predicción de superficies" . Tecnometría . 35 (3): 243-255. doi : 10.1080 / 00401706.1993.10485320 .
^ Chung, H.-S .; Alonso, JJ (2002). "Uso de gradientes para construir modelos de aproximación de Cokriging para problemas de optimización de diseño de alta dimensión". AIAA 40th Aerospace Sciences Meeting and Exhibit : 2002–0317. CiteSeerX 10.1.1.12.4149 . doi : 10.2514 / 6.2002-317 .
^ Han, Z.-H .; Gortz, S .; Zimmermann, R. (2013). "Mejora del modelado sustituto de fidelidad variable mediante kriging mejorado por gradiente y una función de puente híbrido generalizada". Ingeniería con Computadoras . 32 (1): 15–34. doi : 10.1016 / j.ast.2012.01.006 .
^ Ulaganathan, S .; Couckuyt, I .; Dhaene, T .; Degroote, J .; Laermans, E. (2016). "Estudio de rendimiento de Kriging mejorado con gradiente" . Ciencia y tecnología aeroespacial . 25 (1): 177–189.
^ Laurent, L .; Le Riche, R .; Soulier, B .; Boucard, P.-A. (2017). "Una descripción general de los metamodelos mejorados con gradiente con aplicaciones" (PDF) . Archivos de métodos computacionales en ingeniería . 26 : 1–46. doi : 10.1007 / s11831-017-9226-3 .
^ Lockwood, BA; Anitescu, M. (2012). "Kriging universal mejorado con gradiente para la propagación de la incertidumbre" (PDF) . Ciencia e Ingeniería Nuclear . 170 (2): 168-195. CiteSeerX 10.1.1.187.6097 . doi : 10.13182 / NSE10-86 .
^ Raggi, G .; Fdez. Galván, I .; Ritterhoff, CL; Vacher, M .; Lindh, R. (2020). "Optimización de geometría molecular de varianza restringida basada en Kriging mejorado con gradiente" . Revista de teoría química y computación . 16 (6): 3989–4001. doi : 10.1021 / acs.jctc.0c00257 . PMC 7304864 . PMID 32374164 .

[mitchell1992-1] Mitchell, M .; Morris, M. (1992). "Diseño y análisis bayesiano de experimentos informáticos: dos ejemplos" (PDF) . Statistica Sinica (2): 359–379.

[debaar2012-2] Baar, JHS; Scholcz, TP; Verhoosel, CV; Dwight, RP; van Zuijlen, AH; Bijl, H. (2012). "Cuantificación eficiente de la incertidumbre con Kriging mejorado con gradiente: aplicaciones en FSI" (PDF) . ECCOMAS, Viena, Austria, 10 al 14 de septiembre .

[debaar2015-3] Baar, JHS; Scholcz, TP; Dwight, RP (2015). "Explotación de derivados adjuntos en metamodelos de alta dimensión". Revista AIAA . 53 (5): 1391-1395. Código bibliográfico : 2015AIAAJ..53.1391D . doi : 10.2514 / 1.J053678 .

[dwight2006-4] Dwight, R .; Brezillon, J. (2006). "Efecto de las aproximaciones del adjunto discreto en la optimización basada en gradientes". Revista AIAA . 44 (12): 3022-3031. Código bibliográfico : 2006AIAAJ..44.3022D . CiteSeerX 10.1.1.711.4761 . doi : 10,2514 / 1,21744 .

[giles2003-5] Giles, M .; Duta, M .; Muller, J .; Pierce, N. (2003). "Desarrollos de algoritmos para métodos adjuntos discretos" . Revista AIAA . 41 (2): 198-205. Código bibliográfico : 2003AIAAJ..41..198G . doi : 10,2514 / 2,1961 . S2CID 2106397 .

[debaar2014a-6] Baar, JHS; Dwight, RP; Bijl, H. (2014). "Mejoras en Kriging mejorado con gradiente utilizando una interpretación bayesiana". Revista internacional de cuantificación de la incertidumbre . 4 (3): 205–223. doi : 10.1615 / Int.J.UncertaintyQuantification.2013006809 .

[7] Wikle, CK; Berliner, LM (2007). "Un tutorial bayesiano para la asimilación de datos". Physica D . 230 (1–2): 1–16. Código bibliográfico : 2007PhyD..230 .... 1W . doi : 10.1016 / j.physd.2006.09.017 .

[dwight2009-8] Dwight, RP; Han, Z.-H. (2009). Cuantificación eficiente de la incertidumbre mediante Kriging mejorado con gradiente (PDF) . XI Conferencia de enfoques no deterministas de la AIAA, Palm Springs, California, 4 a 7 de mayo . doi : 10.2514 / 6.2009-2276 . ISBN 978-1-60086-975-4.

[laurenceau2008-9] Laurenceau, J .; Sagaut, P. (2008). "Construyendo superficies de respuesta eficientes de funciones aerodinámicas con Kriging y coKriging". Revista AIAA . 46 (2): 498–507. Código bibliográfico : 2008AIAAJ..46..498L . doi : 10,2514 / 1,32308 . S2CID 17895486 .

[10] Baar, JHS (2014). "Sustitutos estocásticos para medidas y modelos informáticos de fluidos" . Tesis de doctorado, Universidad Tecnológica de Delft : 99–101.

[bouhlel2018-11] Bouhlel, MA; Martins, JRRA (2018). "Kriging mejorado con gradiente para problemas de alta dimensión". Ingeniería con Computadoras . 35 : 157-173. arXiv : 1708.02663 . doi : 10.1007 / s00366-018-0590-x .

[morris1993-12] Morris, MD; Mitchell, TJ; Ylvisaker, D. (1993). "Diseño y análisis bayesiano de experimentos informáticos: uso de derivados en la predicción de superficies" . Tecnometría . 35 (3): 243-255. doi : 10.1080 / 00401706.1993.10485320 .

[chung2002-13] Chung, H.-S .; Alonso, JJ (2002). "Uso de gradientes para construir modelos de aproximación de Cokriging para problemas de optimización de diseño de alta dimensión". AIAA 40th Aerospace Sciences Meeting and Exhibit : 2002–0317. CiteSeerX 10.1.1.12.4149 . doi : 10.2514 / 6.2002-317 .

[han2013-14] Han, Z.-H .; Gortz, S .; Zimmermann, R. (2013). "Mejora del modelado sustituto de fidelidad variable mediante kriging mejorado por gradiente y una función de puente híbrido generalizada". Ingeniería con Computadoras . 32 (1): 15–34. doi : 10.1016 / j.ast.2012.01.006 .

[ulaganathan2016-15] Ulaganathan, S .; Couckuyt, I .; Dhaene, T .; Degroote, J .; Laermans, E. (2016). "Estudio de rendimiento de Kriging mejorado con gradiente" . Ciencia y tecnología aeroespacial . 25 (1): 177–189.

[laurent2017-16] Laurent, L .; Le Riche, R .; Soulier, B .; Boucard, P.-A. (2017). "Una descripción general de los metamodelos mejorados con gradiente con aplicaciones" (PDF) . Archivos de métodos computacionales en ingeniería . 26 : 1–46. doi : 10.1007 / s11831-017-9226-3 .

[lockwood2010-17] Lockwood, BA; Anitescu, M. (2012). "Kriging universal mejorado con gradiente para la propagación de la incertidumbre" (PDF) . Ciencia e Ingeniería Nuclear . 170 (2): 168-195. CiteSeerX 10.1.1.187.6097 . doi : 10.13182 / NSE10-86 .

[Raggi2020-18] Raggi, G .; Fdez. Galván, I .; Ritterhoff, CL; Vacher, M .; Lindh, R. (2020). "Optimización de geometría molecular de varianza restringida basada en Kriging mejorado con gradiente" . Revista de teoría química y computación . 16 (6): 3989–4001. doi : 10.1021 / acs.jctc.0c00257 . PMC 7304864 . PMID 32374164 .

[1]