Polinomio de Wilkinson

En análisis numérico , el polinomio de Wilkinson es un polinomio específico que fue utilizado por James H. Wilkinson en 1963 para ilustrar una dificultad al encontrar la raíz de un polinomio: la ubicación de las raíces puede ser muy sensible a las perturbaciones en los coeficientes del polinomio.

Gráfica de sgn ( w ( x )) log (1 + - w ( x ) -)

El polinomio es

{\ Displaystyle w (x) = \ prod _ {i = 1} ^ {20} (xi) = (x-1) (x-2) \ cdots (x-20).}

A veces, el término polinomio de Wilkinson también se usa para referirse a otros polinomios que aparecen en la discusión de Wilkinson.

Fondo

El polinomio de Wilkinson surgió en el estudio de algoritmos para encontrar las raíces de un polinomio

{\ Displaystyle p (x) = \ sum _ {i = 0} ^ {n} c_ {i} x ^ {i}.}

Es una cuestión natural en el análisis numérico preguntarse si el problema de encontrar las raíces de p a partir de los coeficientes c _i está bien condicionado . Es decir, esperamos que un pequeño cambio en los coeficientes lleve a un pequeño cambio en las raíces. Desafortunadamente, este no es el caso aquí.

El problema está mal condicionado cuando el polinomio tiene una raíz múltiple. Por ejemplo, el polinomio x ² tiene una raíz doble en x = 0. Sin embargo, el polinomio x ² - ε (una perturbación de tamaño ε ) tiene raíces en ± √ ε , que es mucho más grande que ε cuando ε es pequeño.

Por lo tanto, es natural esperar que también ocurra un mal condicionamiento cuando el polinomio tiene ceros que están muy cerca. Sin embargo, el problema también puede estar extremadamente mal condicionado para polinomios con ceros bien separados. Wilkinson usó el polinomio w ( x ) para ilustrar este punto (Wilkinson 1963).

En 1984, describió el impacto personal de este descubrimiento:

Hablando por mí mismo, lo considero la experiencia más traumática de mi carrera como analista numérico. ^[1]

El polinomio de Wilkinson se usa a menudo para ilustrar lo indeseable de calcular ingenuamente los valores propios de una matriz calculando primero los coeficientes del polinomio característico de la matriz y luego encontrando sus raíces, ya que usar los coeficientes como un paso intermedio puede introducir un mal acondicionamiento extremo incluso si el El problema original estaba bien condicionado. ^[2]

Condicionamiento del polinomio de Wilkinson

Polinomio de Wilkinson

{\ Displaystyle w (x) = \ prod _ {i = 1} ^ {20} (xi) = (x-1) (x-2) \ cdots (x-20)}

claramente tiene 20 raíces, ubicadas en x = 1, 2, ..., 20. Estas raíces están muy separadas. Sin embargo, el polinomio todavía está muy mal acondicionado.

Ampliando el polinomio, se encuentra

{\ displaystyle {\ begin {alineado} w (x) = {} & x ^ {20} -210x ^ {19} + 20615x ^ {18} -1256850x ^ {17} + 53327946x ^ {16} \\ & {} -1672280820x ^ {15} + 40171771630x ^ {14} -756111184500x ^ {13} \\ & {} + 11310276995381x ^ {12} -135585182899530x ^ {11} \\ & {} + 1307535010540395x ^ {1055} -105545022 ^9986 9} \\ & {} + 63030812099294896x ^ {8} -311333643161390640x ^ {7} \\ & {} + 1206647803780373360x ^ {6} -3599979517947607200x ^ {5} \\ & {} + 8037811822645051776x87097093x ^ {412} {3} \\ & {} + 13803759753640704000x ^ {2} -8752948036761600000x \\ & {} + 2432902008176640000. \ end {alineado}}}

Si el coeficiente de x ¹⁹ se reduce de −210 en 2 ⁻²³ a −210,0000001192, entonces el valor del polinomio w (20) disminuye de 0 a −2 ⁻²³ 20 ¹⁹ = −6,25 × 10 ¹⁷ , y la raíz en x = 20 crece ax ≈ 20,8. Las raíces en x = 18 yx = 19 chocan en una raíz doble en x ≈ 18.62 que se convierte en un par de raíces conjugadas complejas en x ≈ 19.5 ± 1.9 i a medida que la perturbación aumenta más. Las 20 raíces se convierten (a 5 decimales)

{\ displaystyle {\ begin {array} {rrrrr} 1.00000 & 2.00000 & 3.00000 & 4.00000 & 5.00000 \\ [8pt] 6.00001 & 6.99970 & 8.00727 & 8.91725 & 20.84691 \\ [8pt] 10.09527 \ pm {} & 11.79363 \ pm {} y 13.99236 \ pm {} y 16.73074 \ pm {} y 19.50244 \ pm {} \\ [- 3pt] 0.64350i y 1.65233i y 2.51883i y 2.81262i y 1.94033i \ end {array}}}

Algunas de las raíces están muy desplazadas, aunque el cambio en el coeficiente es pequeño y las raíces originales parecen estar muy espaciadas. Wilkinson mostró mediante el análisis de estabilidad discutido en la siguiente sección que este comportamiento está relacionado con el hecho de que algunas raíces α (como α = 15) tienen muchas raíces β que están "cercanas" en el sentido de que | α - β | es menor que | α |.

Wilkinson eligió la perturbación de 2 ⁻²³ porque su computadora Pilot ACE tenía significados de coma flotante de 30 bits , por lo que para números alrededor de 210, 2 ⁻²³ fue un error en la primera posición de bit no representada en la computadora. Los dos números reales, −210 y −210-2 ⁻²³ , están representados por el mismo número de coma flotante, lo que significa que 2 ⁻²³ es el error inevitable al representar un coeficiente real cercano a −210 por un número de coma flotante en ese ordenador. El análisis de perturbación muestra que la precisión del coeficiente de 30 bits es insuficiente para separar las raíces del polinomio de Wilkinson.

Análisis de estabilidad

Suponga que perturbamos un polinomio p ( x ) = Π ( x - α _j ) con raíces α _j sumando un pequeño múltiplo t · c ( x ) de un polinomio c ( x ), y preguntemos cómo afecta esto a las raíces α _j . A primer orden, el cambio en las raíces será controlado por la derivada

{\ Displaystyle {d \ alpha _ {j} \ over dt} = - {c (\ alpha _ {j}) \ over p ^ {\ prime} (\ alpha _ {j})}.}

Cuando la derivada es grande, las raíces serán menos estables bajo variaciones de t y, a la inversa, si esta derivada es pequeña, las raíces serán estables. En particular, si α _j es una raíz múltiple, el denominador desaparece. En este caso, α _j generalmente no es diferenciable con respecto a t (a menos que c desaparezca allí), y las raíces serán extremadamente inestables.

Para valores pequeños de t, la raíz perturbada está dada por la expansión de la serie de potencias en t

{\ Displaystyle \ alpha _ {j} + {d \ alpha _ {j} \ sobre dt} t + {d ^ {2} \ alpha _ {j} \ sobre dt ^ {2}} {t ^ {2} \ más de 2!} + \ cdots}

y uno espera problemas cuando | t | es mayor que el radio de convergencia de esta serie de potencias, que viene dado por el valor más pequeño de | t | tal que la raíz α _{j se} vuelva múltiple. Una estimación muy burda de este radio toma la mitad de la distancia desde α _j hasta la raíz más cercana y divide por la derivada anterior.

En el ejemplo del polinomio de Wilkinson de grado 20, las raíces están dadas por α _j = j para j = 1, ..., 20, y c ( x ) es igual ax ¹⁹ . Entonces la derivada está dada por

{\ Displaystyle {d \ alpha _ {j} \ over dt} = - {\ alpha _ {j} ^ {19} \ over \ prod _ {k \ neq j} (\ alpha _ {j} - \ alpha _ {k})} = - \ prod _ {k \ neq j} {\ alpha _ {j} \ over \ alpha _ {j} - \ alpha _ {k}}. \, \!}

Esto muestra que la raíz α _j será menos estable si hay muchas raíces α _k cercanas a α _j , en el sentido de que la distancia | α _j - α _k | entre ellos es menor que | α _j |.

Ejemplo . Para la raíz α ₁ = 1, ¡la derivada es igual a 1/19! que es muy pequeño; esta raíz es estable incluso para grandes cambios en t . Esto se debe a que todas las demás raíces β están muy lejos de él, en el sentido de que | α ₁ - β | = 1, 2, 3, ..., 19 es mayor que | α ₁ | = 1. Por ejemplo, incluso si t es tan grande como –10000000000, la raíz α ₁ solo cambia de 1 a aproximadamente 0,99999991779380 (que está muy cerca de la aproximación de primer orden 1 + t / 19! ≈ 0,99999991779365). De manera similar, las otras raíces pequeñas del polinomio de Wilkinson son insensibles a los cambios en t .

Ejemplo . Por otro lado, para la raíz alpha ₂₀ = 20, el IS derivada igual a -20 ¹⁹ /19! que es enorme (alrededor de 43000000), por lo que esta raíz es muy sensible a pequeños cambios en t . Las otras raíces β están cerca de α ₂₀ , en el sentido de que | β - α ₂₀ | = 1, 2, 3, ..., 19 es menor que | α ₂₀ | = 20. Para t = -2 ^{- 23} el primer orden de aproximación 20 - t · 20 ¹⁹ /19! = 25.137 ... a la raíz perturbada 20.84 ... es terrible; esto es aún más obvio para la raíz α ₁₉ donde la raíz perturbada tiene una gran parte imaginaria pero la aproximación de primer orden (y para el caso todas las aproximaciones de orden superior) son reales. La razón de esta discrepancia es que | t | ≈ 0.000000119 es mayor que el radio de convergencia de la serie de potencia mencionada anteriormente (que es aproximadamente 0.0000000029, algo menor que el valor 0.00000001 dado por la estimación bruta) por lo que la teoría linealizada no se aplica. Para un valor como t = 0.000000001 que es significativamente más pequeño que este radio de convergencia, la aproximación de primer orden 19.9569 ... está razonablemente cerca de la raíz 19.9509 ...

A primera vista, las raíces α ₁ = 1 y α ₂₀ = 20 del polinomio de Wilkinson parecen ser similares, ya que están en extremos opuestos de una línea simétrica de raíces y tienen el mismo conjunto de distancias 1, 2, 3, .. ., 19 de otras raíces. Sin embargo, el análisis anterior muestra que esto es extremadamente engañoso: la raíz α ₂₀ = 20 es menos estable que α ₁ = 1 (para pequeñas perturbaciones en el coeficiente de x ¹⁹ ) por un factor de 20 ¹⁹ = 5242880000000000000000000.

El segundo ejemplo de Wilkinson

El segundo ejemplo considerado por Wilkinson es

{\ Displaystyle w_ {2} (x) = \ prod _ {i = 1} ^ {20} (x-2 ^ {- i}) = (x-2 ^ {- 1}) (x-2 ^ { -2}) \ cdots (x-2 ^ {- 20}).}

Los veinte ceros de este polinomio están en una progresión geométrica con razón común 2, y por lo tanto el cociente

{\ Displaystyle \ alpha _ {j} \ over \ alpha _ {j} - \ alpha _ {k}}

no puede ser grande. De hecho, los ceros de w ₂ son bastante estables a grandes cambios relativos en los coeficientes.

El efecto de la base

La expansión

{\ Displaystyle p (x) = \ sum _ {i = 0} ^ {n} c_ {i} x ^ {i}}

expresa el polinomio en una base particular, a saber, la de los monomios. Si el polinomio se expresa en otra base, entonces el problema de encontrar sus raíces puede dejar de estar mal condicionado. Por ejemplo, en una forma de Lagrange , un pequeño cambio en uno (o varios) coeficientes no necesita cambiar demasiado las raíces. De hecho, los polinomios base para la interpolación en los puntos 0, 1, 2, ..., 20 son

{\ Displaystyle \ ell _ {k} (x) = \ prod _ {i \ in \ {0, \ ldots, 20 \} \ setminus \ {k \}} {\ frac {xi} {ki}}, \ qquad {\ text {para}} \ quad k = 0, \ ldots, 20.}

Cada polinomio (de grado 20 o menos) se puede expresar en esta base:

{\ Displaystyle p (x) = \ sum _ {i = 0} ^ {20} d_ {i} \ ell _ {i} (x).}

Para el polinomio de Wilkinson, encontramos

{\ Displaystyle w (x) = (20!) \ ell _ {0} (x) = \ sum _ {i = 0} ^ {20} d_ {i} \ ell _ {i} (x) \ quad { \ text {con}} \ quad d_ {0} = (20!), \, d_ {1} = d_ {2} = \ cdots = d_ {20} = 0.}

Dada la definición del polinomio de base de Lagrange ℓ ₀ ( x ), un cambio en el coeficiente d ₀ no producirá ningún cambio en las raíces de w . Sin embargo, una perturbación en los otros coeficientes (todos iguales a cero) cambiará ligeramente las raíces. Por lo tanto, el polinomio de Wilkinson está bien condicionado en esta base.

Notas

^ Wilkinson, James H. (1984). "El polinomio pérfido". En Gene H. Golub (ed.). Estudios de Análisis Numérico . Asociación Matemática de América. pag. 3. ISBN 978-0-88385-126-5.
^ Trefethen, Lloyd N .; Bau, David (1997), Álgebra lineal numérica , SIAM

Referencias

Wilkinson discutió "su" polinomio en

JH Wilkinson (1959). La evaluación de los ceros de polinomios mal acondicionados. Parte I. Numerische Mathematik 1 : 150-166.
JH Wilkinson (1963). Errores de redondeo en procesos algebraicos . Englewood Cliffs, Nueva Jersey: Prentice Hall.

Se menciona en libros de texto estándar en análisis numérico, como

FS Acton, métodos numéricos que funcionan , ISBN 978-0-88385-450-1 , pág. 201.

Otras referencias:

Ronald G. Mosier (julio de 1986). Vecindarios raíz de un polinomio. Matemáticas de la computación 47 (175): 265-273.
JH Wilkinson (1984). El polinomio pérfido. Estudios de análisis numérico , ed. por GH Golub, págs. 1–28. (Estudios de Matemáticas, vol. 24). Washington, DC: Asociación Matemática de América.

Se presenta un cálculo numérico de alta precisión en:

Ray Buvel, Polynomials And Rational Functions , parte del RPN Calculator User Manual (para Python), recuperado el 29 de julio de 2006.

[1] Wilkinson, James H. (1984). "El polinomio pérfido". En Gene H. Golub (ed.). Estudios de Análisis Numérico . Asociación Matemática de América. pag. 3. ISBN 978-0-88385-126-5.

[TrefethenBau-2] Trefethen, Lloyd N .; Bau, David (1997), Álgebra lineal numérica , SIAM

[1]