Experimento informático

Un experimento por computadora o un experimento de simulación es un experimento que se utiliza para estudiar una simulación por computadora, también conocido como un sistema in silico . Esta área incluye física computacional , química computacional , biología computacional y otras disciplinas similares.

Fondo

Las simulaciones por computadora se construyen para emular un sistema físico. Debido a que están destinados a replicar algún aspecto de un sistema en detalle, a menudo no producen una solución analítica. Por lo tanto, se utilizan métodos como la simulación de eventos discretos o los solucionadores de elementos finitos . Se utiliza un modelo de computadora para hacer inferencias sobre el sistema que replica. Por ejemplo, los modelos climáticos se utilizan a menudo porque la experimentación con un objeto del tamaño de la Tierra es imposible.

Objetivos

Los experimentos por computadora se han empleado con muchos propósitos en mente. Algunos de ellos incluyen:

Cuantificación de la incertidumbre : caracterice la incertidumbre presente en una simulación por computadora que surge de las incógnitas durante la construcción de la simulación por computadora.
Problemas inversos : descubra las propiedades subyacentes del sistema a partir de los datos físicos.
Corrección de sesgo: utilice datos físicos para corregir el sesgo en la simulación.
Asimilación de datos : combine múltiples simulaciones y fuentes de datos físicos en un modelo predictivo completo.
Diseño de sistemas : encuentre entradas que den como resultado medidas óptimas de rendimiento del sistema.

Modelado de simulación por computadora

El modelado de experimentos informáticos generalmente utiliza un marco bayesiano. La estadística bayesiana es una interpretación del campo de la estadística donde toda la evidencia sobre el verdadero estado del mundo se expresa explícitamente en forma de probabilidades . En el ámbito de los experimentos informáticos, la interpretación bayesiana implicaría que debemos formar una distribución previa que represente nuestra creencia previa en la estructura del modelo informático. El uso de esta filosofía para experimentos informáticos comenzó en la década de 1980 y está muy bien resumido por Sacks et al. (1989) [1] . Si bien el enfoque bayesiano se usa ampliamente, los enfoques frecuentistas se han discutido recientemente [2] .

La idea básica de este marco es modelar la simulación por computadora como una función desconocida de un conjunto de entradas. La simulación por computadora se implementa como una pieza de código de computadora que se puede evaluar para producir una colección de resultados. Ejemplos de entradas para estas simulaciones son los coeficientes del modelo subyacente, las condiciones iniciales y las funciones de forzamiento . Es natural ver la simulación como una función determinista que mapea estas entradas en una colección de salidas . Sobre la base de ver nuestro simulador de esta manera, es común referirse a la colección de entradas como ${\ Displaystyle x}$ , la simulación por computadora en sí misma como ${\ Displaystyle f}$ , y la salida resultante como ${\ Displaystyle f (x)}$ . Ambas cosas ${\ Displaystyle x}$ y ${\ Displaystyle f (x)}$ son cantidades vectoriales y pueden ser colecciones muy grandes de valores, a menudo indexados por espacio, por tiempo, o por espacio y tiempo.

Aunque ${\ Displaystyle f (\ cdot)}$ es conocido en principio, en la práctica este no es el caso. Muchos simuladores comprenden decenas de miles de líneas de código informático de alto nivel, que no es accesible a la intuición. Para algunas simulaciones, como los modelos climáticos, la evaluación de la salida para un solo conjunto de entradas puede requerir millones de horas de computadora [3] .

Proceso gaussiano previo

El modelo típico para una salida de código de computadora es un proceso gaussiano. Para simplificar la notación, suponga ${\ Displaystyle f (x)}$ es un escalar. Debido al marco bayesiano, fijamos nuestra creencia de que la función ${\ Displaystyle f}$ sigue un proceso gaussiano , ${\ Displaystyle f \ sim \ operatorname {GP} (m (\ cdot), C (\ cdot, \ cdot)),}$ dónde ${\ Displaystyle m}$ es la función media y ${\ Displaystyle C}$ es la función de covarianza. Las funciones medias populares son polinomios de orden bajo y una función de covarianza popular es la covarianza de Matern , que incluye tanto la exponencial ( ${\ Displaystyle \ nu = 1/2}$ ) y covarianzas gaussianas (como ${\ Displaystyle \ nu \ rightarrow \ infty}$ ).

Diseño de experimentos informáticos

El diseño de experimentos por computadora tiene diferencias considerables con el diseño de experimentos para modelos paramétricos. Dado que un proceso gaussiano a priori tiene una representación dimensional infinita, los conceptos de criterios A y D (ver Diseño óptimo ), que se enfocan en reducir el error en los parámetros, no se pueden utilizar. Las réplicas también serían un desperdicio en los casos en que la simulación por computadora no tiene errores. Los criterios que se utilizan para determinar un buen diseño experimental incluyen el error de predicción cuadrático medio integrado [4] y los criterios basados en la distancia [5] .

Las estrategias populares para el diseño incluyen muestreo de hipercubo latino y secuencias de baja discrepancia .

Problemas con tamaños de muestra masivos

A diferencia de los experimentos físicos, es común que los experimentos de computadora tengan miles de combinaciones de entrada diferentes. Debido a que la inferencia estándar requiere la inversión matricial de una matriz cuadrada del tamaño del número de muestras ( ${\ Displaystyle n}$ ), el costo crece en el ${\ Displaystyle {\ mathcal {O}} (n ^ {3})}$ . La inversión matricial de matrices grandes y densas también puede causar inexactitudes numéricas. Actualmente, este problema se resuelve mediante técnicas ávidas de árboles de decisión, que permiten cálculos efectivos para una dimensionalidad ilimitada y tamaño de muestra, patente WO2013055257A1 , o se evita mediante el uso de métodos de aproximación, por ejemplo, [6] .

Ver también

Otras lecturas

Santner, Thomas (2003). El diseño y análisis de experimentos informáticos . Berlín: Springer. ISBN 0-387-95420-1.

Fehr, Jörg; Heiland, Jan; Himpe, cristiano; Saak, Jens (2016). "Mejores prácticas para la replicabilidad, reproducibilidad y reutilización de experimentos basados en computadora ejemplificados por software de reducción de modelos". OBJETIVOS Matemáticas . 1 (3): 261–281. arXiv : 1607.01191 . doi : 10.3934 / Math.2016.3.261 .