El método de Steffensen

En el análisis numérico , el método de Steffensen es una técnica de búsqueda de raíces que lleva el nombre de Johan Frederik Steffensen, que es similar al método de Newton . El método de Steffensen también logra la convergencia cuadrática , pero sin usar derivadas como lo hace el método de Newton .

Descripción simple

La forma más simple de la fórmula del método de Steffensen ocurre cuando se usa para encontrar los ceros o raíces de una función. ${\ Displaystyle \, f \,}$ ; es decir: encontrar el valor ${\ Displaystyle \, x _ {\ star} \,}$ que satisface ${\ Displaystyle f (x _ {\ star}) = 0}$ . Cerca de la solución ${\ Displaystyle \, x _ {\ star} \,}$ , la función ${\ Displaystyle \, f \,}$ se supone que satisface aproximadamente ${\ Displaystyle ~ -1$ esta condición hace ${\ Displaystyle \, f \,}$ adecuado como función de corrección para ${\ Displaystyle \, x \,}$ para encontrar su propia solución, aunque no es necesario que funcione de manera eficiente. Para algunas funciones, el método de Steffensen puede funcionar incluso si no se cumple esta condición, pero en tal caso, el valor inicial ${\ Displaystyle \, x_ {0} \,}$ debe estar muy cerca de la solución real ${\ Displaystyle \, x _ {\ star} \,}$ y la convergencia a la solución puede ser lenta.

Dado un valor inicial adecuado ${\ Displaystyle \, x_ {0} \,}$ , una secuencia de valores ${\ Displaystyle ~ x_ {0}, \, x_ {1}, \, x_ {2}, \ dots, \, x_ {n}, \, \ dots ~}$ se puede generar usando la fórmula siguiente. Cuando funciona, cada valor en la secuencia está mucho más cerca de la solución. ${\ displaystyle x _ {\ star}}$ que el valor anterior. El valor ${\ Displaystyle \, x_ {n} \,}$ del paso actual genera el valor ${\ Displaystyle \, x_ {n + 1} \,}$ para el siguiente paso, a través de esta fórmula: ^[1]

{\ Displaystyle x_ {n + 1} = x_ {n} - {\ frac {\, f (x_ {n}) \,} {g (x_ {n})}} ~}

para $n = 0, 1, 2, 3, ...,$ donde la función pendiente ${\ Displaystyle g (x)}$ es un compuesto de la función original ${\ Displaystyle f}$ dado por la siguiente fórmula:

{\ Displaystyle g (x) = {\ frac {\, f \ left (x + f (x) \ right) \,} {f (x)}} - 1 ~}

o equivalente

{\ Displaystyle g (x) = {\ frac {\, f (x + h) -f (x) \,} {h}} ~}

dónde

{\ Displaystyle ~ h = f (x) ~}

.

La función ${\ Displaystyle g}$ es el valor medio de la pendiente de la función ${\ Displaystyle f}$ entre el último punto de secuencia ${\ Displaystyle (x, y) = (x_ {n}, \ f (x_ {n}))}$ y el punto auxiliar ${\ Displaystyle \, (x, y) = (x_ {n} + h, \, f (x_ {n} + h) \,)}$ , con el paso ${\ Displaystyle \, h = f (x_ {n}) \,}$ . También se denomina diferencia dividida de primer orden de ${\ Displaystyle f}$ entre esos dos puntos.

Es solo con el propósito de encontrar ${\ Displaystyle \, h \,}$ para este punto auxiliar que el valor de la función ${\ Displaystyle \, f \,}$ debe ser una corrección adecuada para acercarse a su propia solución, y por ello cumplir con el requisito de que ${\ Displaystyle \, - 1$ . Para todas las demás partes del cálculo, el método de Steffensen solo requiere la función ${\ Displaystyle \, f \,}$ ser continuo y tener una solución cercana. ^[1] Varias modificaciones modestas del paso ${\ Displaystyle \, h \,}$ en el cálculo de pendiente ${\ Displaystyle \, g \,}$ existen para acomodar funciones ${\ Displaystyle \, f \,}$ que no cumplen con el requisito.

Ventajas e inconvenientes

La principal ventaja del método de Steffensen es que tiene convergencia cuadrática ^[1] como el método de Newton, es decir, ambos métodos encuentran raíces en una ecuación. ${\ Displaystyle f}$ igual de "rápido". En este caso, rápidamente significa que para ambos métodos, el número de dígitos correctos en la respuesta se duplica con cada paso. Pero la fórmula del método de Newton requiere la evaluación de la derivada de la función ${\ Displaystyle f '}$ así como la función ${\ Displaystyle f}$ , mientras que el método de Steffensen solo requiere ${\ Displaystyle f}$ sí mismo. Esto es importante cuando el derivado no está disponible de manera fácil o eficiente.

El precio de la convergencia rápida es la evaluación de doble función: Ambos ${\ Displaystyle f (x_ {n})}$ y ${\ Displaystyle f (x_ {n} + h)}$ debe calcularse, lo que puede llevar mucho tiempo si ${\ Displaystyle f}$ es una función complicada. A modo de comparación, el método de la secante solo necesita una evaluación de función por paso. El método de la secante aumenta el número de dígitos correctos "sólo" en un factor de aproximadamente 1,6 por paso, pero se pueden hacer el doble de pasos del método de la secante en un tiempo determinado. Dado que el método de la secante puede realizar el doble de pasos al mismo tiempo que el método de Steffensen, ^[a] cuando ambos algoritmos tienen éxito, el método de la secante converge más rápido que el método de Steffensen en la práctica real: el método de la secante alcanza un factor de aproximadamente (1.6) ² ≈ 2,6 veces más dígitos por cada dos pasos (dos evaluaciones de funciones), en comparación con el factor 2 de Steffensen para cada paso (dos evaluaciones de funciones).

Similar a la mayoría de los otros algoritmos iterativos de búsqueda de raíces , la debilidad crucial en el método de Steffensen es la elección del valor inicial ${\ Displaystyle x_ {0}}$ . Si el valor de ${\ Displaystyle x_ {0}}$ no está lo suficientemente cerca de la solución real ${\ displaystyle x _ {\ star}}$ , el método puede fallar y la secuencia de valores ${\ Displaystyle x_ {0}, x_ {1}, x_ {2}, x_ {3}, \ dots}$ puede cambiar entre dos extremos o divergir hasta el infinito.

Derivación utilizando el proceso delta cuadrado de Aitken

La versión del método de Steffensen implementada en el código MATLAB que se muestra a continuación se puede encontrar utilizando el proceso delta cuadrado de Aitken para acelerar la convergencia de una secuencia. Para comparar las siguientes fórmulas con las fórmulas de la sección anterior, observe que ${\ Displaystyle x_ {n} = p \ - \ p_ {n}}$ . Este método supone comenzar con una secuencia linealmente convergente y aumenta la tasa de convergencia de esa secuencia. Si los signos de ${\ Displaystyle p_ {n}, \ p_ {n + 1}, \ p_ {n + 2}}$ de acuerdo y ${\ Displaystyle p_ {n} \}$ está 'suficientemente cerca' del límite deseado de la secuencia ${\ Displaystyle p \}$ , podemos asumir lo siguiente:

{\ Displaystyle {\ frac {p_ {n + 1} -p} {p_ {n} -p}} \ approx {\ frac {p_ {n + 2} -p} {p_ {n + 1} -p} }}

luego

{\ Displaystyle (p_ {n + 1} -p) ^ {2} \ approx (p_ {n + 2} -p) (p_ {n} -p)}

entonces

{\ Displaystyle p_ {n + 1} ^ {2} -2p_ {n + 1} p + p ^ {2} \ approx p_ {n + 2} p_ {n} - (p_ {n} + p_ {n + 2}) p + p ^ {2}}

y por lo tanto

{\ Displaystyle (p_ {n + 2} -2p_ {n + 1} + p_ {n}) p \ approx p_ {n + 2} p_ {n} -p_ {n + 1} ^ {2}}

.

Resolviendo el límite deseado de la secuencia ${\ Displaystyle p}$ da:

{\ Displaystyle p \ approx {\ frac {p_ {n + 2} p_ {n} -p_ {n + 1} ^ {2}} {p_ {n + 2} -2p_ {n + 1} + p_ {n }}} = {\ frac {p_ {n} ^ {2} + p_ {n} p_ {n + 2} + 2p_ {n} p_ {n + 1} -2p_ {n} p_ {n + 1} - p_ {n} ^ {2} -p_ {n + 1} ^ {2}} {p_ {n + 2} -2p_ {n + 1} + p_ {n}}}}

{\ Displaystyle = {\ frac {(p_ {n} ^ {2} + p_ {n} p_ {n + 2} -2p_ {n} p_ {n + 1}) - (p_ {n} ^ {2} -2p_ {n} p_ {n + 1} + p_ {n + 1} ^ {2})} {p_ {n + 2} -2p_ {n + 1} + p_ {n}}}}

{\ Displaystyle = p_ {n} - {\ frac {(p_ {n + 1} -p_ {n}) ^ {2}} {p_ {n + 2} -2p_ {n + 1} + p_ {n} }},}

lo que da como resultado la secuencia convergente más rápida:

{\ Displaystyle p \ approx p_ {n + 3} = p_ {n} - {\ frac {(p_ {n + 1} -p_ {n}) ^ {2}} {p_ {n + 2} -2p_ { n + 1} + p_ {n}}}.}

Implementación en Matlab

Aquí está la fuente para una implementación del método de Steffensen en MATLAB .

función Steffensen ( f, p0, tol ) % Esta función toma como entradas: una función de iteración de punto fijo, f, % y estimación inicial al punto fijo, p0, y una tolerancia, tol.% Se supone que la función de iteración de punto fijo se introduce como% función en línea. % Esta función calculará y devolverá el punto fijo, p, % que hace que la expresión f (x) = p sea verdadera dentro de la deseada % de tolerancia, tol.formato compacto % Esto acorta la salida.  format long % Imprime más posiciones decimales.  para i = 1 : 1000 % prepárese para hacer un número grande, pero finito, de iteraciones.   % Esto es para que si el método no converge, no % estar atrapado en un bucle infinito. p1 = f ( p0 ); % calcula las dos próximas conjeturas para el punto fijo.  p2 = f ( p1 ); p = p0 - ( p1 - p0 ) ^ 2 / ( p2 - 2 * p1 + p0 ) % usa el método delta cuadrado de Aitken para  % encuentra una mejor aproximación a p0. if abs ( p - p0 ) < tol % prueba para ver si estamos dentro de la tolerancia.   break % si lo estamos, detengamos las iteraciones, tenemos nuestra respuesta.  final p0 = p ; % actualiza p0 para la siguiente iteración. finalif abs ( p - p0 ) > tol % Si no cumplimos con la tolerancia, generamos un   % mensaje de error. 'no pudo converger en 1000 iteraciones.'final

Implementación en Python

Aquí está la fuente para una implementación del método de Steffensen en Python .

def  g ( f ,  x :  float ,  fx :  float ):  "" "Función de diferencia dividida de primer orden. Argumentos:  f (invocable): Entrada de función ag  x (float): Punto en el que evaluar g  fx (float): Función f evaluada en x  "" "  return  lambda  x :  f ( x  +  fx )  /  fx  -  1def  steff ( f ,  x :  float ):  "" "Algoritmo de Steffenson para encontrar raíces. Este generador recursivo produce el valor x_n + 1 primero y luego, cuando el generador itera,  produce x_n + 2 desde el siguiente nivel de recursividad. Argumentos:  f (invocable): función cuya raíz buscamos  x (float): valor inicial en la primera llamada, cada nivel n en el que la función recurre x es x_n  "" "  fx  =  f ( x )  gx  =  g ( f , x ,  fx ) ( x )  si  gx  ! =  0 :  rendimiento  x  -  fx  /  gx  # Primero da x_n + 1  rendimiento de  steff ( f ,  x  -  fx  /  gx )  # Luego da un nuevo iterador

Generalización

El método de Steffensen también se puede utilizar para encontrar una entrada ${\ Displaystyle x = x _ {\ star}}$ para un tipo diferente de función ${\ Displaystyle F}$ que produce la misma salida que su entrada: ${\ Displaystyle x _ {\ star} = F (x _ {\ star})}$ por el valor especial ${\ displaystyle x _ {\ star}}$ . Soluciones como ${\ displaystyle x _ {\ star}}$ se llaman puntos fijos . Muchas de estas funciones se pueden utilizar para encontrar sus propias soluciones reciclando repetidamente el resultado como entrada, pero la tasa de convergencia puede ser lenta o la función puede no converger en absoluto, dependiendo de la función individual. El método de Steffensen acelera esta convergencia, para hacerla cuadrática .

Este método para encontrar puntos fijos de una función de valor real se ha generalizado para funciones ${\ Displaystyle F: X \ a X}$ en un espacio de Banach ${\ Displaystyle X}$ . El método generalizado asume que una familia de operadores lineales acotados ${\ Displaystyle \ {L (u, v): u, v \ in X \}}$ asociado con ${\ Displaystyle u \}$ y ${\ Displaystyle v \}$ se puede encontrar para satisfacer la condición ^[2]

{\ Displaystyle F (u) -F (v) = L (u, v) \ (uv).}

En la forma simple dada en la sección anterior, la función ${\ Displaystyle f}$ simplemente toma y produce números reales. Ahí, la función ${\ Displaystyle g}$ es una diferencia dividida . En la forma generalizada aquí, el operador ${\ Displaystyle L}$ es el análogo de una diferencia dividida para su uso en el espacio de Banach . El operador ${\ Displaystyle L}$ es equivalente a una matriz cuyas entradas son todas funciones de argumentos vectoriales ${\ Displaystyle u \}$ y ${\ Displaystyle v \}$ .

El método de Steffensen es entonces muy similar al método de Newton, excepto que usa la diferencia dividida ${\ Displaystyle L (F (x), x) \}$ en lugar de la derivada ${\ Displaystyle F '(x) \}$ . Por lo tanto, se define por

{\ Displaystyle x_ {n + 1} = x_ {n} + [IL (F (x_ {n}), x_ {n})] ^ {- 1} (F (x_ {n}) - x_ {n} ), \}

por ${\ Displaystyle n = 1, \ 2, \ 3, \ ...}$ , y donde ${\ Displaystyle I \}$ es el operador de identidad.

Si el operador ${\ Displaystyle L \}$ satisface

{\ Displaystyle \ | L (u, v) -L (x, y) \ | \ leq k {\ big (} \ | ux \ | + \ | vy \ | {\ big)}}

por alguna constante ${\ Displaystyle k}$ , entonces el método converge cuadráticamente a un punto fijo de ${\ Displaystyle F}$ si la aproximación inicial ${\ Displaystyle x_ {0} \}$ está 'suficientemente cerca' de la solución deseada ${\ displaystyle x _ {\ star}}$ , eso satisface ${\ Displaystyle x _ {\ star} = F (x _ {\ star})}$ .

Notas

^ Porque ${\ Displaystyle f (x_ {n} + h)}$ requiere el cálculo previo de ${\ Displaystyle h = f (x_ {n})}$ , las dos evaluaciones deben realizarse de forma secuencial; el algoritmo en sí no puede acelerarse ejecutando las evaluaciones de funciones en paralelo. Ésta es otra desventaja más del método de Steffensen.

Referencias

^ ^a ^b ^c Dahlquist, Germund ; Björck, Åke (1974). Métodos numéricos . Traducido por Anderson, Ned. Englewood Cliffs, Nueva Jersey: Prentice Hall. págs. 230–231 .
^ Johnson, LW; Scholz, DR (junio de 1968). "Sobre el método de Steffensen". Revista SIAM de Análisis Numérico . 5 (2): 296-302. doi : 10.1137 / 0705026 . JSTOR 2949443 .

[2] Porque ${\ Displaystyle f (x_ {n} + h)}$ requiere el cálculo previo de ${\ Displaystyle h = f (x_ {n})}$ , las dos evaluaciones deben realizarse de forma secuencial; el algoritmo en sí no puede acelerarse ejecutando las evaluaciones de funciones en paralelo. Ésta es otra desventaja más del método de Steffensen.

[Dahlquist-1] Dahlquist, Germund ; Björck, Åke (1974). Métodos numéricos . Traducido por Anderson, Ned. Englewood Cliffs, Nueva Jersey: Prentice Hall. págs. 230–231 .

[Johnson-3] Johnson, LW; Scholz, DR (junio de 1968). "Sobre el método de Steffensen". Revista SIAM de Análisis Numérico . 5 (2): 296-302. doi : 10.1137 / 0705026 . JSTOR 2949443 .

[1]