En matemáticas , una ecuación rígida es una ecuación diferencial para la cual ciertos métodos numéricos para resolver la ecuación son numéricamente inestables , a menos que se considere que el tamaño del paso es extremadamente pequeño. Ha resultado difícil formular una definición precisa de rigidez, pero la idea principal es que la ecuación incluye algunos términos que pueden conducir a una rápida variación en la solución.
Al integrar una ecuación diferencial numéricamente, uno esperaría que el tamaño de paso requerido sea relativamente pequeño en una región donde la curva solución muestra mucha variación y relativamente grande donde la curva solución se endereza para acercarse a una línea con pendiente casi cero. Para algunos problemas, este no es el caso. Para que un método numérico dé una solución confiable al sistema diferencial, a veces se requiere que el tamaño del paso esté en un nivel inaceptablemente pequeño en una región donde la curva de solución es muy suave. El fenómeno se conoce como rigidez.. En algunos casos, puede haber dos problemas diferentes con la misma solución, pero uno no es rígido y el otro sí. Por tanto, el fenómeno no puede ser una propiedad de la solución exacta, ya que esta es la misma para ambos problemas y debe ser una propiedad del propio sistema diferencial. Por tanto, tales sistemas se conocen como sistemas rígidos .
Ejemplo motivador
Considere el problema del valor inicial
( 1 )
La solución exacta (mostrada en cian) es
- con como
( 2 )
Buscamos una solución numérica que exhiba el mismo comportamiento.
La figura (derecha) ilustra los problemas numéricos de varios integradores numéricos aplicados en la ecuación.
- El método de Euler con un tamaño de paso de h = 1/4 oscila violentamente y sale rápidamente del rango del gráfico (mostrado en rojo).
- El método de Euler con la mitad del tamaño del paso, h = 1/8, produce una solución dentro de los límites del gráfico, pero oscila alrededor de cero (mostrado en verde).
- El método trapezoidal (es decir, el método Adams-Moulton de dos etapas ) viene dado por
( 3 )
Uno de los ejemplos más destacados de las ecuaciones diferenciales ordinarias rígidas (ODE) es un sistema que describe la reacción química de Robertson: [1]
( 4 )
Si uno trata este sistema en un intervalo corto, por ejemplo, no hay problema en la integración numérica. Sin embargo, si el intervalo es muy grande ( digamos 10 11 ), muchos códigos estándar no lo integran correctamente.
Ejemplos adicionales son los conjuntos de ODE que resultan de la integración temporal de grandes mecanismos de reacción química. Aquí, la rigidez surge de la coexistencia de reacciones muy lentas y muy rápidas. [ cita requerida ] Para resolverlos, se pueden utilizar los paquetes de software KPP y Autochem .
Relación de rigidez
Considere el sistema no homogéneo de coeficiente constante lineal
( 5 )
dónde y es una constante, diagonalizable, matriz con valores propios (asumidos distintos) y vectores propios correspondientes . La solución general de ( 5 ) toma la forma
( 6 )
donde las κ t son constantes arbitrarias yes una integral particular. Ahora supongamos que
( 7 )
lo que implica que cada uno de los términos como , para que la solución enfoques asintóticamente como ; el terminodecaerá monótonamente si λ t es real y sinusoidal si λ t es complejo. Interpretando x como tiempo (como ocurre a menudo en problemas físicos),se llama la solución transitoria yla solución de estado estacionario . Si es grande, entonces el término correspondiente decaerá rápidamente a medida que aumente x, por lo que se denomina transitorio rápido ; Si es pequeño, el término correspondiente decae lentamente y se denomina transitorio lento . Dejar ser definido por
( 8 )
así que eso es el transitorio más rápido y el más lento. Ahora definimos la relación de rigidez como
( 9 )
Caracterización de la rigidez
En esta sección consideramos varios aspectos del fenómeno de la rigidez. "Fenómeno" es probablemente una palabra más apropiada que "propiedad", ya que esta última implica más bien que la rigidez puede definirse en términos matemáticos precisos; resulta que no es posible hacer esto de manera satisfactoria, incluso para la clase restringida de sistemas de coeficientes constantes lineales. También veremos varias afirmaciones cualitativas que pueden hacerse (y en su mayoría se han hecho) en un intento de encapsular la noción de rigidez, y establecer cuál es probablemente la más satisfactoria de ellas como una "definición" de rigidez.
JD Lambert define la rigidez de la siguiente manera:
Si un método numérico con una región finita de estabilidad absoluta , aplicado a un sistema con cualquier condición inicial , se ve obligado a utilizar en un cierto intervalo de integración una longitud de paso que es excesivamente pequeña en relación con la suavidad de la solución exacta en ese intervalo , entonces se dice que el sistema es rígido en ese intervalo.
Hay otras características que exhiben muchos ejemplos de problemas de rigidez, pero para cada uno hay contraejemplos, por lo que estas características no constituyen una buena definición de rigidez. No obstante, las definiciones basadas en estas características son de uso común por algunos autores y son buenas pistas sobre la presencia de rigidez. Lambert se refiere a estos como "declaraciones" en lugar de definiciones, por las razones antes mencionadas. Algunos de estos son:
- Un sistema de coeficientes constantes lineales es rígido si todos sus valores propios tienen una parte real negativa y la relación de rigidez es grande.
- La rigidez se produce cuando los requisitos de estabilidad, en lugar de los de precisión, limitan la longitud del paso.
- La rigidez ocurre cuando algunos componentes de la solución se descomponen mucho más rápidamente que otros. [3]
Etimología
El origen del término "rigidez" no se ha establecido claramente. Según Joseph Oakland Hirschfelder , el término "rígido" se utiliza debido a que tales sistemas corresponden a estrecho acoplamiento entre el conductor y conducido en servomecanismos . [4] Según Richard. L. Burden y J. Douglas Faires,
Pueden surgir dificultades significativas cuando se aplican técnicas numéricas estándar para aproximar la solución de una ecuación diferencial cuando la solución exacta contiene términos de la forma e λt , donde λ es un número complejo con una parte real negativa.
...
Los problemas que involucran soluciones transitorias que decaen rápidamente ocurren naturalmente en una amplia variedad de aplicaciones, incluido el estudio de sistemas de amortiguación y resortes, el análisis de sistemas de control y problemas de cinética química . Todos estos son ejemplos de una clase de problemas llamados sistemas rígidos (rigidez matemática) de ecuaciones diferenciales, debido a su aplicación en el análisis del movimiento de resortes y sistemas de masa que tienen grandes constantes de resorte ( rigidez física ). [5]
Por ejemplo, el problema del valor inicial
( 10 )
con m = 1, c = 1001, k = 1000, se puede escribir en la forma ( 5 ) con n = 2 y
( 11 )
( 12 )
( 13 )
y tiene valores propios . Ambos valores propios tienen una parte real negativa y la relación de rigidez es
( 14 )
que es bastante grande. El sistema ( 10 ) ciertamente satisface los enunciados 1 y 3. Aquí la constante de resorte k es grande y la constante de amortiguamiento c es aún mayor. [6] (Tenga en cuenta que "grande" es un término subjetivo y vago, pero cuanto mayores sean las cantidades anteriores, más pronunciado será el efecto de la rigidez). La solución exacta de ( 10 ) es
( 15 )
Tenga en cuenta que ( 15 ) se comporta casi como una exponencial simple x 0 e - t , pero la presencia del término e −1000 t , incluso con un coeficiente pequeño, es suficiente para hacer que el cálculo numérico sea muy sensible al tamaño del paso. La integración estable de ( 10 ) requiere un tamaño de paso muy pequeño hasta bien en la parte suave de la curva de solución, lo que resulta en un error mucho menor que el requerido para la precisión. Por tanto, el sistema también satisface el enunciado 2 y la definición de Lambert.
A-estabilidad
El comportamiento de los métodos numéricos en problemas rígidos se puede analizar aplicando estos métodos a la ecuación de prueba y ' = ky sujeto a la condición inicial y (0) = 1 con. La solución de esta ecuación es y ( t ) = e kt . Esta solución se acerca a cero cuando Cuándo Si el método numérico también muestra este comportamiento (para un tamaño de paso fijo), entonces se dice que el método es A-estable. [7] (Tenga en cuenta que un método numérico que es L-estable (ver más abajo) tiene la propiedad más fuerte de que la solución se acerca a cero en un solo paso cuando el tamaño del paso llega al infinito). Los métodos A-estables no presentan los problemas de inestabilidad como se describe en el ejemplo motivador.
Métodos de Runge-Kutta
Métodos de Runge-Kutta aplicados a la ecuación de prueba coje la forma , y, por inducción, . La funciónse llama función de estabilidad . Por lo tanto, la condición de que como es equivalente a . Esto motiva la definición de la región de estabilidad absoluta (a veces denominada simplemente región de estabilidad ), que es el conjunto. El método es A-estable si la región de estabilidad absoluta contiene el conjunto, es decir, el semiplano izquierdo.
Ejemplo: los métodos de Euler
Considere los métodos de Euler anteriores. El método de Euler explícito aplicado a la ecuación de prueba es
Por eso, con . Por tanto, la región de estabilidad absoluta para este método esque es el disco que se muestra a la derecha. El método de Euler no es estable.
El ejemplo motivador había . El valor de z al tomar el tamaño del paso es , que está fuera de la región de estabilidad. De hecho, los resultados numéricos no convergen a cero. Sin embargo, con el tamaño del paso, tenemos que está justo dentro de la región de estabilidad y los resultados numéricos convergen a cero, aunque con bastante lentitud.
Ejemplo: método trapezoidal
Considere el método trapezoidal
cuando se aplica a la ecuación de prueba , es
Resolviendo para rendimientos
Por tanto, la función de estabilidad es
y la región de estabilidad absoluta es
Esta región contiene el semiplano izquierdo, por lo que el método trapezoidal es estable en A. De hecho, la región de estabilidad es idéntica al semiplano izquierdo y, por tanto, la solución numérica deconverge a cero si y solo si la solución exacta lo hace. Sin embargo, el método trapezoidal no tiene un comportamiento perfecto: humedece todos los componentes en descomposición, pero los componentes que se descomponen rápidamente se amortiguan solo muy levemente, porque como . Esto llevó al concepto de estabilidad L : un método es estable L si es estable A y como . El método trapezoidal es estable en A pero no estable en L. El método de Euler implícito es un ejemplo de un método L estable. [8]
Teoría general
La función de estabilidad de un método de Runge-Kutta con coeficientes y es dado por
dónde denota el vector con unos. Esta es una función racional (un polinomio dividido por otro).
Los métodos explícitos de Runge-Kutta tienen una matriz de coeficiente triangular estrictamente inferiory por tanto, su función de estabilidad es un polinomio. De ello se deduce que los métodos explícitos de Runge-Kutta no pueden ser A-estable.
La función de estabilidad de los métodos implícitos de Runge-Kutta a menudo se analiza utilizando estrellas de orden . La estrella de orden para un método con función de estabilidad. se define como el conjunto . Un método es A-estable si y solo si su función de estabilidad no tiene polos en el plano de la izquierda y su orden estrella no contiene números puramente imaginarios. [9]
Métodos de varios pasos
Los métodos lineales de varios pasos tienen la forma
Aplicados a la ecuación de prueba, se convierten en
que se puede simplificar a
donde z = hk . Ésta es una relación de recurrencia lineal . El método es A-estable si todas las soluciones { y n } de la relación de recurrencia convergen a cero cuando Re z <0. El polinomio característico es
Todas las soluciones convergen a cero para un valor dado de z si todas las soluciones w de Φ ( z , w ) = 0 se encuentran en el círculo unitario.
La región de estabilidad absoluta para un método de varios pasos de la forma anterior es entonces el conjunto de todos para lo cual todos w tales que Φ ( z , w ) = 0 satisfacen | w | <1. Nuevamente, si este conjunto contiene el semiplano izquierdo, se dice que el método de múltiples pasos es A-estable.
Ejemplo: el método Adams-Bashforth de segundo orden
Determinemos la región de estabilidad absoluta para el método de Adams-Bashforth de dos pasos
El polinomio característico es
que tiene raíces
por tanto, la región de estabilidad absoluta es
Esta región se muestra a la derecha. No incluye todo el semiplano izquierdo (de hecho, solo incluye el eje real entre z = −1 yz = 0), por lo que el método Adams-Bashforth no es A-estable.
Teoría general
Los métodos explícitos de varios pasos nunca pueden ser A-Stables, al igual que los métodos explícitos de Runge-Kutta. Los métodos implícitos de varios pasos solo pueden ser A-estables si su orden es como máximo 2. Este último resultado se conoce como la segunda barrera de Dahlquist ; restringe la utilidad de los métodos lineales de varios pasos para ecuaciones rígidas. Un ejemplo de un método A-estable de segundo orden es la regla trapezoidal mencionada anteriormente, que también se puede considerar como un método lineal de varios pasos. [10]
Ver también
- Número de condición
- Inclusión diferencial , una extensión de la noción de ecuación diferencial que permite discontinuidades, en parte como una forma de eludir algunos problemas de rigidez.
- Métodos explícitos e implícitos
Notas
- ^ Robertson, HH (1966). "La solución de un conjunto de ecuaciones de velocidad de reacción". Análisis numérico: una introducción . Prensa académica. págs. 178-182.
- ^ Lambert (1992 , págs. 216-217)
- ^ Lambert (1992 , págs. 217-220)
- ^ Hirshfelder (1963)
- ^ Carga y ferias (1993 , p. 314)
- ^ Kreyszig (1972 , págs. 62-68)
- ↑ Esta definición se debe a Dahlquist (1963) .
- ^ La definición de estabilidad L se debe a Ehle (1969) .
- ^ La definición se debe a Wanner, Hairer & Nørsett (1978) ; véase también Iserles y Nørsett (1991) .
- ^ Véase Dahlquist (1963) .
Referencias
- Burden, Richard L .; Faires, J. Douglas (1993), Análisis numérico (5.a ed.), Boston: Prindle, Weber y Schmidt , ISBN 0-534-93219-3.
- Dahlquist, Germund (1963), "Un problema de estabilidad especial para métodos lineales de varios pasos", BIT , 3 (1): 27–43, doi : 10.1007 / BF01963532 , hdl : 10338.dmlcz / 103497.
- Eberly, David (2008), Análisis de estabilidad para sistemas de ecuaciones diferenciales (PDF).
- Ehle, BL (1969), Aproximaciones de Padé a la función exponencial y métodos A-estable para la solución numérica de problemas de valor inicial (PDF) , Universidad de Waterloo.
- Gear, CW (1971), Problemas numéricos de valor inicial en ecuaciones diferenciales ordinarias , Englewood Cliffs: Prentice Hall.
- Gear, CW (1981), "Solución numérica de ecuaciones diferenciales ordinarias: ¿queda algo por hacer?", SIAM Review , 23 (1): 10-24, doi : 10.1137 / 1023002.
- Hairer, Ernst; Wanner, Gerhard (1996), Resolver ecuaciones diferenciales ordinarias II: Problemas rígidos y algebraicos diferenciales (segunda ed.), Berlín: Springer-Verlag , ISBN 978-3-540-60452-5.
- Hirshfelder, JO (1963), "Matemáticas aplicadas como se utilizan en la química teórica", Simposio de la American Mathematical Society : 367–376.
- Iserles, Arieh; Nørsett, Syvert (1991), Order Stars , Chapman & Hall , ISBN 978-0-412-35260-7.
- Kreyszig, Erwin (1972), Matemáticas de ingeniería avanzada (3.a ed.), Nueva York: Wiley , ISBN 0-471-50728-8.
- Lambert, JD (1977), D. Jacobs (ed.), "El problema del valor inicial para ecuaciones diferenciales ordinarias", The State of the Art in Numerical Analysis , Nueva York: Academic Press : 451–501.
- Lambert, JD (1992), Métodos numéricos para sistemas diferenciales ordinarios , Nueva York: Wiley , ISBN 978-0-471-92990-1.
- Mathews, John; Fink, Kurtis (1992), Métodos numéricos usando MATLAB.
- Presione, WH; Teukolsky, SA; Vetterling, WT; Flannery, BP (2007). "Sección 17.5. Conjuntos rígidos de ecuaciones" . Recetas numéricas: el arte de la informática científica (3ª ed.). Nueva York: Cambridge University Press. ISBN 978-0-521-88068-8.
- Shampine, LF; Gear, CW (1979), "La visión de un usuario de la resolución de ecuaciones diferenciales ordinarias rígidas" , Revisión de SIAM , 21 (1): 1-17, doi : 10.1137 / 1021001.
- Wanner, Gerhard; Hairer, Ernst; Nørsett, Syvert (1978), "Orden de estrellas y teoría de la estabilidad", BIT , 18 (4): 475–489, doi : 10.1007 / BF01932026.
- Estabilidad de los métodos de Runge-Kutta [1]
enlaces externos
- Introducción al modelado basado en la física: funciones energéticas y rigidez
- Sistemas rígidos Lawrence F. Shampine y Skip Thompson Scholarpedia , 2 (3): 2855. doi: 10.4249 / scholarpedia.2855