Teorema de Cayley-Hamilton

En álgebra lineal , el teorema de Cayley-Hamilton (llamado así por los matemáticos Arthur Cayley y William Rowan Hamilton ) establece que cada matriz cuadrada sobre un anillo conmutativo (como el campo real o complejo ) satisface su propia ecuación característica .

Arthur Cayley , FRS (1821–1895) es ampliamente considerado como el principal matemático puro de Gran Bretaña del siglo XIX. Cayley en 1848 fue a Dublín para asistir a conferencias sobre cuaterniones impartidas por Hamilton, su descubridor. Más tarde Cayley lo impresionó al ser el segundo en publicar trabajos sobre ellos. ^[1] Cayley demostró el teorema para matrices de dimensión 3 y menos, publicando pruebas para el caso bidimensional. ^[2]^[3] En cuanto a las matrices

n \times n

, Cayley afirmó “..., no he creído necesario emprender el trabajo de una demostración formal del teorema en el caso general de una matriz de cualquier grado”.

William Rowan Hamilton (1805-1865), físico, astrónomo y matemático irlandés, primer miembro extranjero de la Academia Nacional Estadounidense de Ciencias . Mientras mantenía una posición opuesta sobre cómo debería estudiarse la geometría, Hamilton siempre se mantuvo en los mejores términos con Cayley. ^[1]

Hamilton demostró que para una función lineal de cuaterniones existe una cierta ecuación, dependiendo de la función lineal, que es satisfecha por la propia función lineal. ^[4]^[5]^[6]

Si $A$ es una matriz $n \times n$ dada e $I n$ es la matriz identidad $n \times n$ , entonces el polinomio característico de $A$ se define como ^[7] ${\ Displaystyle p (\ lambda) = \ det (\ lambda I_ {n} -A)}$ , donde $det$ es la operación determinante y $λ$ es una variable para un elemento escalar del anillo base. Dado que las entradas de la matriz ${\ Displaystyle (\ lambda I_ {n} -A)}$ son polinomios (lineales o constantes) en $λ$ , el determinante es también un polinomio mónico de $n$ -ésimo orden en $λ$ , ${\ Displaystyle p (\ lambda) = \ lambda ^ {n} + c_ {n-1} \ lambda ^ {n-1} + \ cdots + c_ {1} \ lambda + c_ {0} ~.}$ Se puede crear un polinomio análogo ${\ Displaystyle p (A)}$ en la matriz $A en$ lugar de la variable escalar $λ$ , definida como ${\ Displaystyle p (A) = A ^ {n} + c_ {n-1} A ^ {n-1} + \ cdots + c_ {1} A + c_ {0} I_ {n} ~.}$ El teorema de Cayley-Hamilton establece que este polinomio da como resultado la matriz cero , es decir, que ${\ Displaystyle p (A) = \ mathbf {0}}$ . El teorema permite $A$ ^$n$ a ser expresada como una combinación lineal de las potencias de matriz inferiores de $A$ . Cuando el anillo es un campo, el teorema de Cayley-Hamilton es equivalente a la afirmación de que el polinomio mínimo de una matriz cuadrada divide su polinomio característico. El teorema fue probado por primera vez en 1853 ^[8] en términos de inversas de funciones lineales de cuaterniones , un anillo no conmutativo , por Hamilton. ^[4]^[5]^[6] Esto corresponde al caso especial de ciertas matrices $4 \times 4$ reales o $2 \times 2$ complejas. El teorema es válido para matrices cuaterniónicas generales. ^[9]^{[nb 1]} Cayley en 1858 lo declaró para matrices de $3 \times 3$ y más pequeñas, pero solo publicó una prueba para el caso de $2 \times 2$ . ^[2] El caso general fue probado por primera vez por Ferdinand Frobenius en 1878. ^[10]

Ejemplos de

Matrices $1 \times 1$

Para una matriz de $1 \times 1$ $A = (a 1,1)$ , el polinomio característico está dado por $p (λ) = λ - a$ , por lo que $p (A) = (a) - a 1,1 = 0$ es trivial.

Matrices $2 \times 2$

Como ejemplo concreto, dejemos

{\ displaystyle A = {\ begin {pmatrix} 1 & 2 \\ 3 & 4 \ end {pmatrix}}.}

Su polinomio característico viene dado por

{\ displaystyle p (\ lambda) = \ det (\ lambda I_ {2} -A) = \ det {\ begin {pmatrix} \ lambda -1 & -2 \\ - 3 & \ lambda -4 \ end {pmatrix}} = (\ lambda -1) (\ lambda -4) - (- 2) (- 3) = \ lambda ^ {2} -5 \ lambda -2.}

El teorema de Cayley-Hamilton afirma que, si definimos

{\ Displaystyle p (X) = X ^ {2} -5X-2I_ {2},}

luego

{\ displaystyle p (A) = A ^ {2} -5A-2I_ {2} = {\ begin {pmatrix} 0 & 0 \\ 0 & 0 \\\ end {pmatrix}}.}

Podemos verificar por cálculo que, de hecho,

{\ displaystyle A ^ {2} -5A-2I_ {2} = {\ begin {pmatrix} 7 & 10 \\ 15 & 22 \\\ end {pmatrix}} - {\ begin {pmatrix} 5 & 10 \\ 15 & 20 \\\ end { pmatrix}} - {\ begin {pmatrix} 2 & 0 \\ 0 & 2 \\\ end {pmatrix}} = {\ begin {pmatrix} 0 & 0 \\ 0 & 0 \\\ end {pmatrix}}.}

Para una matriz genérica de $2 \times 2$ ,

{\ displaystyle A = {\ begin {pmatrix} a & b \\ c & d \\\ end {pmatrix}},}

el polinomio característico está dado por $p$ $($ $λ$ $) =$ $λ$ $2$ $- ($ $a$ $+$ $d$ $)$ $λ$ $+ ($ $ad$ $-$ $bc$ $)$ , por lo que el teorema de Cayley-Hamilton establece que

{\ Displaystyle p (A) = A ^ {2} - (a + d) A + (ad-bc) I_ {2} = {\ begin {pmatrix} 0 & 0 \\ 0 & 0 \\\ end {pmatrix}};}

lo cual es siempre el caso, evidente al calcular las entradas de $A$ ² .

Aplicaciones

Matriz determinante e inversa

Para una matriz $A$ invertible general $n \times n$ , es decir, una con un determinante distinto de cero, $A$ ⁻¹ se puede escribir como una expresión polinomial de $($ $n$ $- 1)$ -ésimo orden en $A$ : Como se indicó, el teorema de Cayley-Hamilton equivale a identidad

${\ Displaystyle p (A) = A ^ {n} + c_ {n-1} A ^ {n-1} + \ cdots + c_ {1} A + (- 1) ^ {n} \ det (A) I_ {n} = 0.}$

Los coeficientes $c i$ son dadas por los polinomios simétricos elementales de los valores propios de $A$ . Usando las identidades de Newton , los polinomios simétricos elementales pueden a su vez expresarse en términos de polinomios simétricos de suma de potencia de los valores propios:

{\ Displaystyle s_ {k} = \ sum _ {i = 1} ^ {n} \ lambda _ {i} ^ {k} = \ operatorname {tr} (A ^ {k}),}

donde $tr (A k)$ es la traza de la matriz $A k$ . Por lo tanto, podemos expresar $c i$ en términos de la traza de potencias de $A$ .

En general, la fórmula para los coeficientes $c i$ se da en términos de polinomios de Bell exponenciales completos como ^{[nb 2]}

{\ Displaystyle c_ {nk} = {\ frac {(-1) ^ {k}} {k!}} B_ {k} (s_ {1}, - 1! s_ {2}, 2! s_ {3} , \ ldots, (- 1) ^ {k-1} (k-1)! s_ {k}).}

En particular, el determinante de $A$ es igual a $(-1) n c 0$ . Por lo tanto, el determinante se puede escribir como la identidad de seguimiento :

{\ Displaystyle \ det (A) = {\ frac {1} {n!}} B_ {n} (s_ {1}, - 1! s_ {2}, 2! s_ {3}, \ ldots, (- 1) ^ {n-1} (n-1)! S_ {n}).}

Asimismo, el polinomio característico se puede escribir como

{\ Displaystyle - (- 1) ^ {n} \ det (A) I_ {n} = A (A ^ {n-1} + c_ {n-1} A ^ {n-2} + \ cdots + c_ {1 en}),}

y, al multiplicar ambos lados por $A -1$ (nota $- (- 1) n = (-1) n -1$ ), uno es llevado a una expresión para el inverso de $A$ como una identidad de traza,

{\ Displaystyle {\ begin {alineado} A ^ {- 1} & = {\ frac {(-1) ^ {n-1}} {\ det A}} (A ^ {n-1} + c_ {n -1} A ^ {n-2} + \ cdots + c_ {1} I_ {n}), \\ [5pt] & = {\ frac {1} {\ det A}} \ sum _ {k = 0 } ^ {n-1} (- 1) ^ {n + k-1} {\ frac {A ^ {nk-1}} {k!}} B_ {k} (s_ {1}, - 1! s_ {2}, 2! S_ {3}, \ ldots, (- 1) ^ {k-1} (k-1)! S_ {k}). \ End {alineado}}}

Otro método para obtener estos coeficientes $c k$ para una matriz general $n \times n$ , siempre que ninguna raíz sea cero, se basa en la siguiente expresión alternativa para el determinante ,

{\ Displaystyle p (\ lambda) = \ det (\ lambda I_ {n} -A) = \ lambda ^ {n} \ exp (\ operatorname {tr} (\ log (I_ {n} -A / \ lambda) )).}

Por tanto, en virtud de la serie Mercator ,

{\ displaystyle p (\ lambda) = \ lambda ^ {n} \ exp \ left (- \ operatorname {tr} \ sum _ {m = 1} ^ {\ infty} {({A \ over \ lambda}) ^ {m} \ over m} \ right),}

donde la exponencial sólo necesita expandirse al orden $λ - n$ , ya que $p (λ)$ es de orden $n$ , las potencias negativas netas de $λ$ desaparecen automáticamente por el teorema C – H. (Nuevamente, esto requiere un anillo que contenga los números racionales). La diferenciación de esta expresión con respecto a $λ$ permite expresar los coeficientes del polinomio característico para $n$ general como determinantes de matrices $m \times m$ , ^{[nb 3]}

{\ displaystyle c_ {nm} = {\ frac {(-1) ^ {m}} {m!}} {\ begin {vmatrix} \ operatorname {tr} A & m-1 & 0 & \ cdots \\\ operatorname {tr} A ^ {2} & \ operatorname {tr} A & m-2 & \ cdots \\\ vdots & \ vdots &&& \ vdots \\\ operatorname {tr} A ^ {m-1} & \ operatorname {tr} A ^ {m- 2} & \ cdots & \ cdots & 1 \\\ operatorname {tr} A ^ {m} & \ operatorname {tr} A ^ {m-1} & \ cdots & \ cdots & \ operatorname {tr} A \ end { vmatrix}} ~.}

Ejemplos de

Por ejemplo, los primeros polinomios de Bell son $B 0$ = 1, $B 1 (x 1) = x 1$ , $B 2 (x 1, x 2) = x 21 + x 2$ y $B 3 (x 1, x 2, x 3) = x 31 + 3 x 1 x 2 + x 3$ .

Utilizándolos para especificar los coeficientes $c i$ del polinomio característico de una matriz de $2 \times 2 se$ obtiene

{\ displaystyle {\ begin {alineado} c_ {2} = B_ {0} = 1, \\ [4pt] c_ {1} = {\ frac {-1} {1!}} B_ {1} (s_ { 1}) = - s_ {1} = - \ operatorname {tr} (A), \\ [4pt] c_ {0} = {\ frac {1} {2!}} B_ {2} (s_ {1} , -1! S_ {2}) = {\ frac {1} {2}} (s_ {1} ^ {2} -s_ {2}) = {\ frac {1} {2}} ((\ nombre del operador {tr} (A)) ^ {2} - \ operatorname {tr} (A ^ {2})). \ end {alineado}}}

El coeficiente $c 0$ da el determinante de la matriz $2 \times 2$ , $c 1$ menos su traza, mientras que su inverso está dado por

{\ Displaystyle A ^ {- 1} = {\ frac {-1} {\ det A}} (A + c_ {1} I_ {2}) = {\ frac {-2 (A- \ operatorname {tr} (A) I_ {2})} {(\ operatorname {tr} (A)) ^ {2} - \ operatorname {tr} (A ^ {2})}}.}

Se desprende de la fórmula general para c _n-k , expresada en términos de polinomios de Bell, que las expresiones

{\ Displaystyle - \ operatorname {tr} (A) \ quad {\ text {y}} \ quad {\ tfrac {1} {2}} (\ operatorname {tr} (A) ^ {2} - \ operatorname { tr} (A ^ {2}))}

Siempre dé los coeficientes $c n -1$ de $λ n -1$ y $c n -2$ de $λ n -2$ en el polinomio característico de cualquier matriz $n \times n$ , respectivamente. Entonces, para una matriz $A de$ $3 \times 3$ , el enunciado del teorema de Cayley-Hamilton también se puede escribir como

{\ Displaystyle A ^ {3} - (\ operatorname {tr} A) A ^ {2} + {\ frac {1} {2}} \ left ((\ operatorname {tr} A) ^ {2} - \ nombre de operador {tr} (A ^ {2}) \ right) A- \ det (A) I_ {3} = O,}

donde el lado derecho designa una matriz de $3 \times 3$ con todas las entradas reducidas a cero. Asimismo, este determinante en el caso $n = 3$ , ahora es

{\ Displaystyle {\ begin {alineado} \ det (A) & = {\ frac {1} {3!}} B_ {3} (s_ {1}, - 1! s_ {2}, 2! s_ {3 }) = {\ frac {1} {6}} (s_ {1} ^ {3} + 3s_ {1} (- s_ {2}) + 2s_ {3}) \\ [5pt] & = {\ tfrac {1} {6}} \ left ((\ operatorname {tr} A) ^ {3} -3 \ operatorname {tr} (A ^ {2}) (\ operatorname {tr} A) +2 \ operatorname {tr } (A ^ {3}) \ right). \ End {alineado}}}

Esta expresión da el negativo del coeficiente $c n -3$ de $λ n -3$ en el caso general, como se ve a continuación.

De manera similar, se puede escribir para una matriz $A de$ $4 \times 4$ ,

{\ Displaystyle A ^ {4} - (\ operatorname {tr} A) A ^ {3} + {\ tfrac {1} {2}} {\ bigl (} (\ operatorname {tr} A) ^ {2} - \ operatorname {tr} (A ^ {2}) {\ bigr)} A ^ {2} - {\ tfrac {1} {6}} {\ bigl (} (\ operatorname {tr} A) ^ {3 } -3 \ operatorname {tr} (A ^ {2}) (\ operatorname {tr} A) +2 \ operatorname {tr} (A ^ {3}) {\ bigr)} A + \ det (A) I_ { 4} = O,}

donde, ahora, el determinante es $c n -4$ ,

{\ displaystyle {\ tfrac {1} {24}} \ left ((\ operatorname {tr} A) ^ {4} -6 \ operatorname {tr} (A ^ {2}) (\ operatorname {tr} A) ^ {2} +3 (\ operatorname {tr} (A ^ {2})) ^ {2} +8 \ operatorname {tr} (A ^ {3}) \ operatorname {tr} (A) -6 \ operatorname {tr} (A ^ {4}) \ right),}

y así sucesivamente para matrices más grandes. Las expresiones cada vez más complejas para los coeficientes $c k$ son deducibles de las identidades de Newton o del algoritmo de Faddeev-LeVerrier .

n -ésima potencia de la matriz

El teorema de Cayley-Hamilton siempre proporciona una relación entre las potencias de $A$ (aunque no siempre la más simple), lo que permite simplificar expresiones que involucran tales potencias y evaluarlas sin tener que calcular la potencia $A n$ o potencias superiores de $A$ .

Como ejemplo, para ${\ displaystyle A = {\ begin {pmatrix} 1 y 2 \\ 3 y 4 \ end {pmatrix}}}$ el teorema da

{\ Displaystyle A ^ {2} = 5A + 2I_ {2} \ ,.}

Luego, para calcular $A 4$ , observe

{\ Displaystyle A ^ {3} = (5A + 2I_ {2}) A = 5A ^ {2} + 2A = 5 (5A + 2I_ {2}) + 2A = 27A + 10I_ {2},}

{\ Displaystyle A ^ {4} = A ^ {3} A = (27A + 10I_ {2}) A = 27A ^ {2} + 10A = 27 (5A + 2I_ {2}) + 10A = 145A + 54I_ { 2} \ ,.}

Igualmente,

{\ Displaystyle A ^ {- 1} = {\ frac {A-5I_ {2}} {2}} ~.}

Observe que hemos podido escribir la potencia de la matriz como la suma de dos términos. De hecho, la potencia matricial de cualquier orden $k$ se puede escribir como un polinomio matricial de grado como máximo $n - 1$ , donde $n$ es el tamaño de una matriz cuadrada. Este es un caso en el que el teorema de Cayley-Hamilton se puede utilizar para expresar una función matricial, que analizaremos a continuación de forma sistemática.

Funciones de matriz

Dada una función analítica

{\ Displaystyle f (x) = \ sum _ {k = 0} ^ {\ infty} a_ {k} x ^ {k}}

y el polinomio característico $p (x)$ de grado $n$ de una matriz $A$ $n \times n$ , la función se puede expresar usando división larga como

{\ Displaystyle f (x) = q (x) p (x) + r (x),}

donde $q (x)$ es un polinomio cociente y $r (x)$ es un polinomio restante tal que $0 \leq grados r (x) < n$ .

Según el teorema de Cayley-Hamilton, al reemplazar $x$ por la matriz $A se$ obtiene $p (A) = 0$ , por lo que se tiene

{\ Displaystyle f (A) = r (A).}

Por tanto, la función analítica de la matriz $A$ se puede expresar como un polinomio matricial de grado menor que $n$ .

Sea el polinomio restante

{\ Displaystyle r (x) = c_ {0} + c_ {1} x + \ cdots + c_ {n-1} x ^ {n-1}.}

Dado que $p (λ) = 0$ , la evaluación de la función $f (x)$ en los $n$ valores propios de $A$ , produce

{\ Displaystyle f (\ lambda _ {i}) = r (\ lambda _ {i}) = c_ {0} + c_ {1} \ lambda _ {i} + \ cdots + c_ {n-1} \ lambda _ {i} ^ {n-1}, \ qquad \ mathrm {para} \ qquad i = 1,2, ..., n.}

Esto equivale a un sistema de $n$ ecuaciones lineales, que se pueden resolver para determinar los coeficientes $c i$ . Por lo tanto, uno tiene

{\ Displaystyle f (A) = \ sum _ {k = 0} ^ {n-1} c_ {k} A ^ {k}.}

Cuando se repiten los valores propios, es decir, $λ i = λ j$ para algunos $i \neq j$ , dos o más ecuaciones son idénticas; y, por tanto, las ecuaciones lineales no se pueden resolver de forma única. En tales casos, para un valor propio $λ$ con multiplicidad $m$ , las primeras $m - 1$ derivadas de $p (x)$ desaparecen en el valor propio. Esto conduce a las soluciones adicionales linealmente independientes $m - 1$

{\ Displaystyle {\ frac {\ mathrm {d} ^ {k} f (x)} {\ mathrm {d} x ^ {k}}} {\ Big |} _ {x = \ lambda} = {\ frac {\ mathrm {d} ^ {k} r (x)} {\ mathrm {d} x ^ {k}}} {\ Big |} _ {x = \ lambda} \ qquad {\ text {para}} \ qquad k = 1,2, \ ldots, m-1,}

lo cual, combinado con otros, produce las $n$ ecuaciones requeridas para resolver $c i$ .

Encontrar un polinomio que pase por los puntos $(λ i, f (λ i))$ es esencialmente un problema de interpolación y se puede resolver utilizando técnicas de interpolación de Lagrange o Newton , lo que lleva a la fórmula de Sylvester .

Por ejemplo, suponga que la tarea es encontrar la representación polinomial de

{\ displaystyle f (A) = e ^ {At} \ qquad \ mathrm {donde} \ qquad A = {\ begin {pmatrix} 1 & 2 \\ 0 & 3 \ end {pmatrix}}.}

El polinomio característico es $p (x) = (x - 1) (x - 3) = x 2 - 4 x + 3$ , y los valores propios son $λ = 1, 3$ . Sea $r (x) = c 0 + c 1 x$ . Evaluación de $f (λ) = r (λ)$ en los valores propios, se obtiene dos ecuaciones lineales, $e t = c 0 + c 1$ y $e 3 t = c 0 + 3 c 1$ .

Resolver las ecuaciones produce $c 0 = (3 e t - e 3 t) / 2$ y $c 1 = (e 3 t - e t) / 2$ . Por tanto, se sigue que

{\ displaystyle e ^ {At} = c_ {0} I_ {2} + c_ {1} A = {\ begin {pmatrix} c_ {0} + c_ {1} & 2c_ {1} \\ 0 & c_ {0} + 3c_ {1} \ end {pmatrix}} = {\ begin {pmatrix} e ^ {t} & e ^ {3t} -e ^ {t} \\ 0 & e ^ {3t} \ end {pmatrix}}.}

Si, en cambio, la función fuera $f (A) = sin At$ , entonces los coeficientes habrían sido $c 0 = (3 sin t - sin 3 t) / 2$ y $c 1 = (sin 3 t - sin t) / 2$ ; por eso

{\ Displaystyle \ sin (At) = c_ {0} I_ {2} + c_ {1} A = {\ begin {pmatrix} \ sin t & \ sin 3t- \ sin t \\ 0 & \ sin 3t \ end {pmatrix }}.}

Como otro ejemplo, al considerar

{\ displaystyle f (A) = e ^ {At} \ qquad \ mathrm {donde} \ qquad A = {\ begin {pmatrix} 0 & 1 \\ - 1 & 0 \ end {pmatrix}},}

entonces el polinomio característico es $p (x) = x 2 + 1$ , y los valores propios son $λ = \pm i$ .

Como antes, la evaluación de la función en los valores propios nos da la lineal ecuaciones $e es = C 0 + ic 1$ y $e - que = c 0 - ic 1$ ; cuya solución da, $c 0 = (e it + e - it) / 2 = cos t$ y $c 1 = (e it - e - it) / 2 i = sin t$ . Por lo tanto, para este caso,

{\ Displaystyle e ^ {At} = (\ cos t) I_ {2} + (\ sin t) A = {\ begin {pmatrix} \ cos t & \ sin t \\ - \ sin t & \ cos t \ end { pmatrix}},}

que es una matriz de rotación .

Ejemplos estándar de tal uso es el mapa exponencial del álgebra de Lie de una matriz de grupo de Lie en el grupo. Está dado por una matriz exponencial ,

{\ Displaystyle \ exp: {\ mathfrak {g}} \ rightarrow G; \ qquad tX \ mapsto e ^ {tX} = \ sum _ {n = 0} ^ {\ infty} {\ frac {t ^ {n} X ^ {n}} {n!}} = I + tX + {\ frac {t ^ {2} X ^ {2}} {2}} + \ cdots, t \ in \ mathbb {R}, X \ in {\ mathfrak {g}}.}

Tales expresiones se conocen desde hace mucho tiempo para $SU (2)$ ,

{\ Displaystyle e ^ {i (\ theta / 2) ({\ hat {n}} \ cdot \ sigma)} = I_ {2} \ cos \ theta / 2 + i ({\ hat {n}} \ cdot \ sigma) \ sin \ theta / 2,}

donde $σ$ son las matrices de Pauli y para $SO (3)$ ,

{\ Displaystyle e ^ {i \ theta ({\ hat {n}} \ cdot \ mathbf {J})} = I_ {3} + i ({\ hat {n}} \ cdot \ mathbf {J}) \ sin \ theta + ({\ hat {n}} \ cdot \ mathbf {J}) ^ {2} (\ cos \ theta -1),}

que es la fórmula de rotación de Rodrigues . Para la notación, vea el grupo de rotación SO (3) # Una nota sobre álgebra de Lie .

Más recientemente, han aparecido expresiones para otros grupos, como el grupo de Lorentz $SO (3, 1)$ , ^[11] $O (4, 2)$ ^[12] y $SU (2, 2)$ , ^[13] así como $GL (n, R)$ . ^[14] El grupo $O (4, 2)$ es el grupo conforme del espacio-tiempo , $SU (2, 2)$ su cubierta simplemente conectada (para ser precisos, la cubierta simplemente conectada del componente conectado $SO + (4, 2)$ de $O (4, 2)$ ). Las expresiones obtenidas se aplican a la representación estándar de estos grupos. Requieren conocimiento de (algunos de) los valores propios de la matriz para exponenciar. Para $SU (2)$ (y por tanto para $SO (3)$ ), se han obtenido expresiones cerradas para todas las representaciones irreducibles, es decir, de cualquier espín. ^[15]

Ferdinand Georg Frobenius (1849-1917), matemático alemán. Sus principales intereses fueron las funciones elípticas , las ecuaciones diferenciales y, posteriormente , la teoría de grupos .
En 1878 dio la primera prueba completa del teorema de Cayley-Hamilton. ^[10]

Teoría algebraica de números

El teorema de Cayley-Hamilton es una herramienta eficaz para calcular el polinomio mínimo de números enteros algebraicos. Por ejemplo, dada una extensión finita ${\ Displaystyle \ mathbb {Q} [\ alpha _ {1}, \ ldots, \ alpha _ {k}]}$ de ${\ Displaystyle \ mathbb {Q}}$ y un entero algebraico ${\ Displaystyle \ alpha \ in \ mathbb {Q} [\ alpha _ {1}, \ ldots, \ alpha _ {k}]}$ que es una combinación lineal distinta de cero de la ${\ Displaystyle \ alpha _ {1} ^ {n_ {1}} \ cdots \ alpha _ {k} ^ {n_ {k}}}$ podemos calcular el polinomio mínimo de ${\ Displaystyle \ alpha}$ encontrando una matriz que represente el ${\ Displaystyle \ mathbb {Q}}$ -transformación lineal

{\ Displaystyle \ cdot \ alpha: \ mathbb {Q} [\ alpha _ {1}, \ ldots, \ alpha _ {k}] \ to \ mathbb {Q} [\ alpha _ {1}, \ ldots, \ alpha _ {k}]}

Si llamamos a esta matriz de transformación ${\ Displaystyle A}$ , entonces podemos encontrar el polinomio mínimo aplicando el teorema de Cayley-Hamilton a ${\ Displaystyle A}$ . ^[dieciséis]

Pruebas

El teorema de Cayley-Hamilton es una consecuencia inmediata de la existencia de la forma normal de Jordan para matrices sobre campos algebraicamente cerrados . En esta sección, se presentan pruebas directas.

Como muestran los ejemplos anteriores, obtener el enunciado del teorema de Cayley-Hamilton para una matriz $n \times n$

{\ Displaystyle A = (a_ {ij}) _ {i, j = 1} ^ {n}}

requiere dos pasos: primero, los coeficientes $c i$ del polinomio característico se determinan mediante el desarrollo como un polinomio en $t$ del determinante

{\ Displaystyle {\ begin {alineado} p (t) & = \ det (tI_ {n} -A) = {\ begin {vmatrix} t-a_ {1,1} & - a_ {1,2} & \ cdots & -a_ {1, n} \\ - a_ {2,1} & t-a_ {2,2} & \ cdots & -a_ {2, n} \\\ vdots & \ vdots & \ ddots & \ vdots \\ - a_ {n, 1} & - a_ {n, 2} & \ cdots & t-a_ {n, n} \ end {vmatrix}} \\ [5pt] & = t ^ {n} + c_ {n -1} t ^ {n-1} + \ cdots + c_ {1} t + c_ {0}, \ end {alineado}}}

y luego estos coeficientes se utilizan en una combinación lineal de potencias de $A$ que se equipara a la matriz nula $n \times n$ :

{\ Displaystyle A ^ {n} + c_ {n-1} A ^ {n-1} + \ cdots + c_ {1} A + c_ {0} I_ {n} = {\ begin {pmatrix} 0 & \ cdots & 0 \\\ vdots & \ ddots & \ vdots \\ 0 & \ cdots & 0 \ end {pmatrix}}.}

El lado izquierdo se puede calcular en una matriz $n \times n$ cuyas entradas son expresiones polinomiales (enormes) en el conjunto de entradas $a i, j$ de $A$ , por lo que el teorema de Cayley-Hamilton establece que cada una de estas $n 2$ expresiones es igual a $0$ . Para cualquier valor fijo de $n$ , estas identidades pueden obtenerse mediante manipulaciones algebraicas tediosas pero sencillas. Sin embargo, ninguno de estos cálculos puede mostrar por qué el teorema de Cayley-Hamilton debería ser válido para matrices de todos los tamaños posibles $n$ , por lo que se necesita una prueba uniforme para todo $n$ .

Preliminares

Si un vector $v$ de tamaño $n$ es un vector propio de $A$ con valor propio $λ$ , en otras palabras, si $A \cdot v = λv$ , entonces

{\ Displaystyle {\ begin {alineado} p (A) \ cdot v & = A ^ {n} \ cdot v + c_ {n-1} A ^ {n-1} \ cdot v + \ cdots + c_ {1} A \ cdot v + c_ {0} I_ {n} \ cdot v \\ [6pt] & = \ lambda ^ {n} v + c_ {n-1} \ lambda ^ {n-1} v + \ cdots + c_ { 1} \ lambda v + c_ {0} v = p (\ lambda) v, \ end {alineado}}}

que es el vector nulo ya que $p (λ) = 0$ (los valores propios de $A$ son precisamente las raíces de $p (t)$ ). Esto es válido para todos los valores propios posibles $λ$ , por lo que las dos matrices igualadas por el teorema ciertamente dan el mismo resultado (nulo) cuando se aplican a cualquier vector propio. Ahora bien, si $A$ admite una base de vectores propios, en otras palabras, si $A$ es diagonalizable , entonces el teorema de Cayley-Hamilton debe ser válido para $A$ , ya que dos matrices que dan los mismos valores cuando se aplican a cada elemento de una base deben ser iguales.

{\ Displaystyle A = XDX ^ {- 1}, \ quad D = \ operatorname {diag} (\ lambda _ {i}), \ quad i = 1,2, ..., n}

{\ Displaystyle p_ {A} (\ lambda) = | \ lambda IA ​​| =}

producto de valores propios de

{\ Displaystyle \ lambda IA ​​= \ prod _ {i = 1} ^ {n} (\ lambda - \ lambda _ {i}) \ equiv \ sum _ {k = 0} ^ {n} c_ {k} \ lambda ^ {k}}

{\ Displaystyle p_ {A} (A) = \ sum c_ {k} A ^ {k} = Xp_ {A} (D) X ^ {- 1} = XCX ^ {- 1}}

{\ Displaystyle C_ {ii} = \ sum _ {k = 0} ^ {n} c_ {k} \ lambda _ {i} ^ {k} = \ prod _ {j = 1} ^ {n} (\ lambda _ {i} - \ lambda _ {j}) = 0, \ qquad C_ {i, j \ neq i} = 0}

{\ Displaystyle \ por lo tanto p_ {A} (A) = XCX ^ {- 1} = O.}

Considere ahora la función ${\ Displaystyle e \ colon M_ {n} \ to M_ {n}}$ que mapas ${\ Displaystyle n \ times n}$ matrices para ${\ Displaystyle n \ times n}$ matrices dadas por la fórmula ${\ Displaystyle e (A) = p_ {A} (A)}$ , es decir, que toma una matriz ${\ Displaystyle A}$ y lo inserta en su propio polinomio característico. No todas las matrices son diagonalizables, pero para matrices con coeficientes complejos, muchas de ellas son: el conjunto de ${\ Displaystyle D}$ Las matrices cuadradas complejas diagonalizables de un tamaño dado son densas en el conjunto de todas estas matrices cuadradas ^[17] (para que una matriz sea diagonalizable es suficiente, por ejemplo, que su polinomio característico no tenga raíces múltiples). Ahora visto como una función ${\ Displaystyle e \ colon \ mathbb {C} ^ {n ^ {2}} \ to \ mathbb {C} ^ {n ^ {2}}}$ (ya que las matrices tienen ${\ Displaystyle n ^ {2}}$ entradas) vemos que esta función es continua . Esto es cierto porque las entradas de la imagen de una matriz están dadas por polinomios en las entradas de la matriz. Desde

${\ displaystyle e (D) = \ left \ {{\ begin {pmatrix} 0 & \ cdots & 0 \\\ vdots & \ ddots & \ vdots \\ 0 & \ cdots & 0 \ end {pmatrix}} \ right \}}$

y desde el set ${\ Displaystyle D}$ es densa, por continuidad esta función debe mapear el conjunto completo de ${\ Displaystyle n \ times n}$ matrices a la matriz cero. Por lo tanto, el teorema de Cayley-Hamilton es cierto para números complejos y, por lo tanto, también debe aplicarse ${\ Displaystyle \ mathbb {Q}}$ - o ${\ Displaystyle \ mathbb {R}}$ -matrices valoradas.

Si bien esto proporciona una prueba válida, el argumento no es muy satisfactorio, ya que las identidades representadas por el teorema no dependen de ninguna manera de la naturaleza de la matriz (diagonalizable o no), ni del tipo de entradas permitidas (para matrices con entradas reales, las diagonalizables no forman un conjunto denso, y parece extraño que uno tenga que considerar matrices complejas para ver que el teorema de Cayley-Hamilton es válido para ellas). Por lo tanto, consideraremos ahora sólo los argumentos que prueban el teorema directamente para cualquier matriz utilizando únicamente manipulaciones algebraicas; estos también tienen la ventaja de trabajar para matrices con entradas en cualquier anillo conmutativo .

Existe una gran variedad de tales demostraciones del teorema de Cayley-Hamilton, de las cuales se darán varias aquí. Varían en la cantidad de nociones algebraicas abstractas necesarias para comprender la demostración. Las demostraciones más simples usan solo las nociones necesarias para formular el teorema (matrices, polinomios con entradas numéricas, determinantes), pero involucran cálculos técnicos que hacen algo misterioso el hecho de que conducen precisamente a la conclusión correcta. Es posible evitar tales detalles, pero al precio de involucrar nociones algebraicas más sutiles: polinomios con coeficientes en un anillo no conmutativo o matrices con tipos de entradas inusuales.

Matrices adyuvadas

Todas las demostraciones siguientes usan la noción de matriz adjunta $adj (M)$ de una matriz $M$ $n \times n$ , la transpuesta de su matriz cofactor .

Esta es una matriz cuyos coeficientes están dados por expresiones polinómicas en los coeficientes de $M$ (de hecho, por ciertos $(n - 1) \times (n - 1)$ determinantes), de tal manera que se cumplen las siguientes relaciones fundamentales,

{\ Displaystyle \ operatorname {adj} (M) \ cdot M = \ det (M) I_ {n} = M \ cdot \ operatorname {adj} (M) ~.}

Estas relaciones son una consecuencia directa de las propiedades básicas de los determinantes: la evaluación de la entrada $(i, j)$ del producto matricial de la izquierda da la expansión por la columna $j$ del determinante de la matriz obtenido de $M$ reemplazando la columna $i$ por una copia de la columna $j$ , que es $det (M)$ si $i = j$ y cero en caso contrario; el producto matricial de la derecha es similar, pero para expansiones por filas.

Siendo una consecuencia de la manipulación de expresiones algebraicas, estas relaciones son válidas para matrices con entradas en cualquier anillo conmutativo (se debe suponer conmutatividad para que los determinantes se definan en primer lugar). Es importante señalar esto aquí, porque estas relaciones se aplicarán a continuación para matrices con entradas no numéricas como polinomios.

Una prueba algebraica directa

Esta demostración utiliza exactamente el tipo de objetos necesarios para formular el teorema de Cayley-Hamilton: matrices con polinomios como entradas. La matriz $t I n - A$ cuyo determinante es el polinomio característico de $A$ es una matriz de este tipo, y dado que los polinomios forman un anillo conmutativo, tiene un adyuvante

{\ Displaystyle B = \ operatorname {adj} (tI_ {n} -A).}

Entonces, de acuerdo con la relación fundamental de la mano derecha del adjugado, uno tiene

{\ Displaystyle (tI_ {n} -A) B = \ det (tI_ {n} -A) I_ {n} = p (t) I_ {n} ~.}

Dado que $B$ también es una matriz con polinomios en $t$ como entradas, uno puede, para cada $i$ , recopilar los coeficientes de $t i$ en cada entrada para formar una matriz $B i$ de números, de modo que se tenga

{\ Displaystyle B = \ sum _ {i = 0} ^ {n-1} t ^ {i} B_ {i} ~.}

(La forma en que se definen las entradas de $B$ deja en claro que no se producen potencias superiores a $t n -1$ ). Si bien esto parece un polinomio con matrices como coeficientes, no consideraremos tal noción; es solo una forma de escribir una matriz con entradas polinomiales como una combinación lineal de $n$ matrices constantes, y el coeficiente $t i$ se ha escrito a la izquierda de la matriz para enfatizar este punto de vista.

Ahora, uno puede expandir el producto de la matriz en nuestra ecuación por bilinealidad

{\ Displaystyle {\ begin {alineado} p (t) I_ {n} & = (tI_ {n} -A) B \\ & = (tI_ {n} -A) \ sum _ {i = 0} ^ { n-1} t ^ {i} B_ {i} \\ & = \ sum _ {i = 0} ^ {n-1} tI_ {n} \ cdot t ^ {i} B_ {i} - \ sum _ {i = 0} ^ {n-1} A \ cdot t ^ {i} B_ {i} \\ & = \ sum _ {i = 0} ^ {n-1} t ^ {i + 1} B_ { i} - \ sum _ {i = 0} ^ {n-1} t ^ {i} AB_ {i} \\ & = t ^ {n} B_ {n-1} + \ sum _ {i = 1} ^ {n-1} t ^ {i} (B_ {i-1} -AB_ {i}) - AB_ {0} ~. \ end {alineado}}}

Escritura

{\ Displaystyle p (t) I_ {n} = t ^ {n} I_ {n} + t ^ {n-1} c_ {n-1} I_ {n} + \ cdots + tc_ {1} I_ {n } + c_ {0} I_ {n} ~,}

se obtiene una igualdad de dos matrices con entradas polinómicas, escritas como combinaciones lineales de matrices constantes con potencias de $t$ como coeficientes.

Tal igualdad sólo puede ser válida si en cualquier posición de la matriz la entrada que se multiplica por una potencia dada $t$ $i$ es la misma en ambos lados; se sigue que las matrices constantes con coeficiente $t$ $i$ en ambas expresiones deben ser iguales. Escribiendo estas ecuaciones entonces para $i$ desde $n$ hasta 0, uno encuentra

{\ Displaystyle B_ {n-1} = I_ {n}, \ qquad B_ {i-1} -AB_ {i} = c_ {i} I_ {n} \ quad {\ text {para}} 1 \ leq i \ leq n-1, \ qquad -AB_ {0} = c_ {0} I_ {n} ~.}

Finalmente, multiplique la ecuación de los coeficientes de $t i$ de la izquierda por $A i$ , y sume:

${\ textstyle A ^ {n} B_ {n-1} + \ sum \ limits _ {i = 1} ^ {n-1} \ left (A ^ {i} B_ {i-1} -A ^ {i +1} B_ {i} \ right) -AB_ {0} = A ^ {n} + c_ {n-1} A ^ {n-1} + \ cdots + c_ {1} A + c_ {0} I_ {n} ~.}$

Los lados izquierdos forman una suma telescópica y se cancelan por completo; los lados derechos suman ${\ Displaystyle p (A)}$ :

{\ Displaystyle 0 = p (A) ~.}

Esto completa la prueba.

Una demostración usando polinomios con coeficientes matriciales

Esta demostración es similar a la primera, pero trata de darle sentido a la noción de polinomio con coeficientes matriciales que fue sugerida por las expresiones que ocurren en esa demostración. Esto requiere un cuidado considerable, ya que es algo inusual considerar polinomios con coeficientes en un anillo no conmutativo, y no todos los razonamientos que son válidos para polinomios conmutativos pueden aplicarse en esta configuración.

En particular, mientras que la aritmética de polinomios sobre un anillo conmutativo modela la aritmética de funciones polinomiales , este no es el caso sobre un anillo no conmutativo (de hecho, no existe una noción obvia de función polinomial en este caso que se cierra con la multiplicación). Entonces, cuando se consideran polinomios en $t$ con coeficientes de matriz, la variable $t$ no debe considerarse como una "desconocida", sino como un símbolo formal que debe manipularse de acuerdo con reglas dadas; en particular, no se puede simplemente establecer $t$ en un valor específico.

{\ Displaystyle (f + g) (x) = \ sum _ {i} \ left (f_ {i} + g_ {i} \ right) x ^ {i} = \ sum _ {i} {f_ {i} x ^ {i}} + \ sum _ {i} {g_ {i} x ^ {i}} = f (x) + g (x).}

Dejar ${\ Displaystyle M (n, R)}$ ser el anillo de ${\ Displaystyle n \ times n}$ matrices con entradas en algún anillo R (como los números reales o complejos) que tiene $A$ como elemento. Matrices con polinomios de coeficientes en $t$ , como ${\ Displaystyle tI_ {n} -A}$ o su adjunto B en la primera prueba, son elementos de ${\ Displaystyle M (n, R [t])}$ .

Al recopilar potencias similares de $t$ , tales matrices se pueden escribir como "polinomios" en $t$ con matrices constantes como coeficientes; escribir ${\ Displaystyle M (n, R) [t]}$ para el conjunto de tales polinomios. Dado que este conjunto está en biyección con ${\ Displaystyle M (n, R [t])}$ , uno define las operaciones aritméticas en él correspondientemente, en particular la multiplicación viene dada por

{\ Displaystyle \ left (\ sum _ {i} M_ {i} t ^ {i} \ right) \ left (\ sum _ {j} N_ {j} t ^ {j} \ right) = \ sum _ { yo, j} (M_ {i} N_ {j}) t ^ {i + j},}

respetar el orden de las matrices de coeficientes de los dos operandos; obviamente esto da una multiplicación no conmutativa.

Por tanto, la identidad

{\ Displaystyle (tI_ {n} -A) B = p (t) I_ {n}.}

de la primera prueba puede verse como una que implica una multiplicación de elementos en ${\ Displaystyle M (n, R) [t]}$ .

En este punto, es tentador simplemente establecer $t$ igual a la matriz $A$ , lo que hace que el primer factor de la izquierda sea igual a la matriz nula y el lado derecho sea igual a $p (A)$ ; sin embargo, esta no es una operación permitida cuando los coeficientes no se conmutan. Es posible definir un "mapa de evaluación de la derecha" ev _$A$ : M [ t ] → M , que reemplaza cada t ⁱ por la potencia matricial $A$ ⁱ de $A$ , donde se estipula que la potencia siempre se debe multiplicar por la derecha al coeficiente correspondiente.

Pero este mapa no es un homomorfismo de anillo: la evaluación correcta de un producto difiere en general del producto de las evaluaciones correctas. Esto es así porque la multiplicación de polinomios con coeficientes matriciales no modela la multiplicación de expresiones que contienen incógnitas: un producto ${\ Displaystyle Mt ^ {i} Nt ^ {j} = (M \ cdot N) t ^ {i + j}}$ se define suponiendo que $t$ conmuta con $N$ , pero esto puede fallar si $t$ se sustituye por la matriz $A$ .

Se puede solucionar esta dificultad en la situación particular en cuestión, ya que el mapa de evaluación de la derecha anterior se convierte en un homomorfismo de anillo si la matriz $A$ está en el centro del anillo de coeficientes, de modo que conmuta con todos los coeficientes de los polinomios. (el argumento que demuestra esto es sencillo, exactamente porque el desplazamiento $t$ con coeficientes ahora se justifica después de la evaluación).

Ahora, $A$ no siempre está en el centro de M , pero podemos reemplazar M con un anillo más pequeño siempre que contenga todos los coeficientes de los polinomios en cuestión: ${\ Displaystyle I_ {n}}$ , $A$ , y los coeficientes ${\ Displaystyle B_ {i}}$ del polinomio B . La elección obvia para tal subanillo es el centralizador Z de $A$ , el subanillo de todas las matrices que conmutan con $A$ ; por definición $A$ está en el centro de Z .

Este centralizador obviamente contiene ${\ Displaystyle I_ {n}}$ , y $A$ , pero hay que demostrar que contiene las matrices ${\ Displaystyle B_ {i}}$ . Para hacer esto, se combinan las dos relaciones fundamentales para los adjuntos, escribiendo el adjugado B como un polinomio:

{\ Displaystyle {\ begin {alineado} \ left (\ sum _ {i = 0} ^ {m} B_ {i} t ^ {i} \ right) (tI_ {n} -A) & = (tI_ {n } -A) \ sum _ {i = 0} ^ {m} B_ {i} t ^ {i} \\\ sum _ {i = 0} ^ {m} B_ {i} t ^ {i + 1} - \ sum _ {i = 0} ^ {m} B_ {i} En ^ {i} & = \ sum _ {i = 0} ^ {m} B_ {i} t ^ {i + 1} - \ sum _ {i = 0} ^ {m} AB_ {i} t ^ {i} \\\ sum _ {i = 0} ^ {m} B_ {i} En ^ {i} & = \ sum _ {i = 0} ^ {m} AB_ {i} t ^ {i}. \ End {alineado}}}

La equiparación de los coeficientes muestra que para cada i , tenemos $A$ B _i = B _i $A$ como se desea. Habiendo encontrado el escenario adecuado en el que ev _$A$ es de hecho un homomorfismo de anillos, se puede completar la demostración como se sugirió anteriormente:

{\ Displaystyle {\ begin {alineado} \ operatorname {ev} _ {A} {\ bigl (} p (t) I_ {n} {\ bigr)} & = \ operatorname {ev} _ {A} ((tI_ {n} -A) B) \\ [5pt] p (A) & = \ operatorname {ev} _ {A} (tI_ {n} -A) \ cdot \ operatorname {ev} _ {A} (B) \\ [5pt] p (A) & = (AI_ {n} -A) \ cdot \ operatorname {ev} _ {A} (B) = O \ cdot \ operatorname {ev} _ {A} (B) = O. \ end {alineado}}}

Esto completa la prueba.

Una síntesis de las dos primeras pruebas.

En la primera prueba, uno pudo determinar los coeficientes $B i$ de $B$ basados en la relación fundamental de la derecha para el adjugado solamente. De hecho, las primeras $n$ ecuaciones derivadas pueden interpretarse como la determinación del cociente $B$ de la división euclidiana del polinomio $p (t) I n$ de la izquierda por el polinomio mónico $I n t - A$ , mientras que la ecuación final expresa el hecho de que el el resto es cero. Esta división se realiza en el anillo de polinomios con coeficientes matriciales. De hecho, incluso a través de un anillo no conmutativo, la división euclidiana por un polinomio mónico $P$ se define, y siempre produce un cociente único y resto con la misma condición grado como en el caso conmutativa, siempre que se especifica en la que un lado desea $P$ a ser un factor (aquí que está a la izquierda).

Para ver que el cociente y el resto son únicos (que es la parte importante del enunciado aquí), basta con escribir ${\ Displaystyle PQ + r = PQ '+ r'}$ como ${\ Displaystyle P (Q-Q ') = r'-r}$ y observe que dado que $P$ es mónico, $P (Q - Q ')$ no puede tener un grado menor que el de $P$ , a menos que $Q = Q'$ .

Pero el dividendo $p (t) I n$ y el divisor $I n t - A$ usados aquí se encuentran en el subanillo $(R [A]) [t]$ , donde $R [A]$ es el subanillo del anillo matriz $M (n, R)$ generada por $una$ : el $R$ lapso -linear de todos los poderes de $una$ . Por lo tanto, la división euclidiana se puede realizar dentro de ese anillo polinomial conmutativo y, por supuesto, da el mismo cociente $B$ y el resto 0 que en el anillo más grande; en particular, esto muestra que $B$ de hecho se encuentra en $(R [A]) [t]$ .

Pero, en esta configuración conmutativa, es válido establecer $t$ en $A$ en la ecuación

{\ Displaystyle p (t) I_ {n} = (tI_ {n} -A) B;}

es decir, aplicar el mapa de evaluación

{\ Displaystyle \ operatorname {ev} _ {A} :( R [A]) [t] \ to R [A]}

que es un homomorfismo de anillo, dando

{\ Displaystyle p (A) = 0 \ cdot \ operatorname {ev} _ {A} (B) = 0}

al igual que en la segunda prueba, como se desee.

Además de probar el teorema, el argumento anterior nos dice que los coeficientes $B$ $i$ de $B$ son polinomios en $A$ , mientras que de la segunda prueba solo sabíamos que se encuentran en el centralizador $Z$ de $A$ ; en general, $Z$ es un subanillo más grande que $R$ $[$ $A$ $]$ , y no necesariamente conmutativo. En particular, el término constante $B$ $0$ $= adj (-$ $A$ $) se$ encuentra en $R$ $[$ $A$ $]$ . Dado que $A$ es una matriz cuadrada arbitraria, esto prueba que $adj ($ $A$ $)$ siempre se puede expresar como un polinomio en $A$ (con coeficientes que dependen de $A$ $)$ .

De hecho, las ecuaciones encontradas en la primera demostración permiten expresar sucesivamente ${\ Displaystyle B_ {n-1}, \ ldots, B_ {1}, B_ {0}}$ como polinomios en $A$ , lo que conduce a la identidad

${\ Displaystyle \ operatorname {adj} (-A) = \ sum _ {i = 1} ^ {n} c_ {i} A ^ {i-1},}$

válido para todas las matrices $n \times n$ , donde

{\ Displaystyle p (t) = t ^ {n} + c_ {n-1} t ^ {n-1} + \ cdots + c_ {1} t + c_ {0}}

es el polinomio característico de $A$ .

Tenga en cuenta que esta identidad también implica el enunciado del teorema de Cayley-Hamilton: uno puede mover $adj (- A)$ al lado derecho, multiplicar la ecuación resultante (a la izquierda o a la derecha) por $A$ , y usar el hecho de que

{\ Displaystyle -A \ cdot \ operatorname {adj} (-A) = \ operatorname {adj} (-A) \ cdot (-A) = \ det (-A) I_ {n} = c_ {0} I_ { norte}.}

Una prueba usando matrices de endomorfismos.

Como se mencionó anteriormente, la matriz p ( A ) enunciado del teorema se obtiene evaluando primero el determinante y luego sustituyendo t por la matriz A ; haciendo esa sustitución en la matriz ${\ Displaystyle tI_ {n} -A}$ antes de evaluar el determinante no es significativo. Sin embargo, es posible dar una interpretación donde p ( A ) se obtiene directamente como el valor de un determinado determinante, pero esto requiere un ajuste más complicado, uno de matrices sobre un anillo en el que se pueden interpretar tanto las entradas ${\ Displaystyle A_ {i, j}}$ de A , y todo de A en sí. Se podría tomar para esto el anillo M ( n , R ) de n × n matrices sobre R , donde la entrada ${\ Displaystyle A_ {i, j}}$ se realiza como ${\ Displaystyle A_ {i, j} I_ {n}}$ y A como él mismo. Pero considerar matrices con matrices como entradas puede causar confusión con matrices de bloque , lo cual no se pretende, ya que da una noción incorrecta de determinante (recuerde que el determinante de una matriz se define como una suma de productos de sus entradas, y en el caso de una matriz de bloques, esto generalmente no es lo mismo que la suma correspondiente de productos de sus bloques). Es más claro distinguir A del endomorfismo φ de un espacio vectorial n- dimensional V (o módulo R libre si R no es un campo) definido por él en una base ${\ Displaystyle e_ {1}, \ ldots, e_ {n}}$ , y tomar matrices sobre el extremo del anillo ( V ) de todos esos endomorfismos. Entonces φ ∈ End ( V ) es una posible entrada de la matriz, mientras que A designa el elemento de M ( n , End ( V )) cuya entrada i , j es el endomorfismo de la multiplicación escalar por ${\ Displaystyle A_ {i, j}}$ ; similar ${\ Displaystyle I_ {n}}$ se interpretará como elemento de M ( n , End ( V )). Sin embargo, dado que End ( V ) no es un anillo conmutativo, no se define ningún determinante en M ( n , End ( V )); esto solo se puede hacer para matrices sobre un subanillo conmutativo de End ( V ). Ahora las entradas de la matriz ${\ Displaystyle \ varphi I_ {n} -A}$ todos se encuentran en el subanillo R [ φ ] generado por la identidad y φ , que es conmutativo. Entonces se define un mapa determinante M ( n , R [ φ ]) → R [ φ ], y ${\ Displaystyle \ det (\ varphi I_ {n} -A)}$ evalúa el valor p ( φ ) del polinomio característico de A en φ (esto se mantiene independientemente de la relación entre A y φ ); el teorema de Cayley-Hamilton establece que p ( φ ) es el endomorfismo nulo.

De esta forma, la siguiente prueba puede obtenerse de la de (Atiyah & MacDonald 1969 , Prop. 2.4) (que de hecho es el enunciado más general relacionado con el lema de Nakayama ; uno toma como ideal en esa proposición el anillo completo R ). El hecho de que A sea la matriz de φ en la base e ₁ , ..., e _n significa que

{\ Displaystyle \ varphi (e_ {i}) = \ sum _ {j = 1} ^ {n} A_ {j, i} e_ {j} \ quad {\ text {for}} i = 1, \ ldots, norte.}

Se pueden interpretar como n componentes de una ecuación en V ⁿ , cuyos miembros se pueden escribir usando el producto matriz-vector M ( n , End ( V )) × V ⁿ → V ⁿ que se define como de costumbre, pero con entradas individuales ψ ∈ El final ( V ) y v en V se "multiplica" formando ${\ Displaystyle \ psi (v)}$ ; esto da:

{\ Displaystyle \ varphi I_ {n} \ cdot E = A ^ {\ operatorname {tr}} \ cdot E,}

dónde ${\ Displaystyle E \ en V ^ {n}}$ es el elemento cuyo componente i es e _i (en otras palabras, es la base e ₁ , ..., e _n de V escrito como una columna de vectores). Escribiendo esta ecuación como

{\ Displaystyle (\ varphi I_ {n} -A ^ {\ operatorname {tr}}) \ cdot E = 0 \ in V ^ {n}}

uno reconoce la transposición de la matriz ${\ Displaystyle \ varphi I_ {n} -A}$ considerado anteriormente, y su determinante (como elemento de M ( n , R [ φ ])) también es p ( φ ). Para derivar de esta ecuación que p ( φ ) = 0 ∈ Fin ( V ), uno a la izquierda se multiplica por la matriz adjunta de ${\ Displaystyle \ varphi I_ {n} -A ^ {\ operatorname {tr}}}$ , que se define en el anillo de matriz M ( n , R [ φ ]), dando

{\ Displaystyle {\ begin {alineado} 0 & = \ operatorname {adj} (\ varphi I_ {n} -A ^ {\ operatorname {tr}}) \ cdot ((\ varphi I_ {n} -A ^ {\ operatorname {tr}}) \ cdot E) \\ & = (\ operatorname {adj} (\ varphi I_ {n} -A ^ {\ operatorname {tr}}) \ cdot (\ varphi I_ {n} -A ^ { \ operatorname {tr}})) \ cdot E \\ & = (\ det (\ varphi I_ {n} -A ^ {\ operatorname {tr}}) I_ {n}) \ cdot E \\ & = (p (\ varphi) I_ {n}) \ cdot E; \ end {alineado}}}

la asociatividad de la multiplicación matriz-matriz y matriz-vector utilizada en el primer paso es una propiedad puramente formal de esas operaciones, independiente de la naturaleza de las entradas. Ahora el componente i de esta ecuación dice que p ( φ ) ( e _i ) = 0 ∈ V ; así p ( φ ) desaparece en todo e _i , y dado que estos elementos generan V, se sigue que p ( φ ) = 0 ∈ End ( V ), completando la demostración.

Un hecho adicional que se sigue de esta demostración es que la matriz A cuyo polinomio característico se toma no necesita ser idéntica al valor φ sustituido en ese polinomio; basta que φ sea un endomorfismo de V que satisfaga las ecuaciones iniciales

{\ Displaystyle \ varphi (e_ {i}) = \ sum _ {j} A_ {j, i} e_ {j}}

para alguna secuencia de elementos e ₁ , ..., e _n que generan V (cuyo espacio podría tener una dimensión menor que n , o en caso de que el anillo R no sea un campo, podría no ser un módulo libre en absoluto).

Una "prueba" falsa: p ( A ) = det ( AI _n - A ) = det ( A - A ) = 0

Un argumento persistente elemental pero incorrecto ^[18] para el teorema es "simplemente" tomar la definición

{\ Displaystyle p (\ lambda) = \ det (\ lambda I_ {n} -A)}

y sustituir $A$ por $λ$ , obteniendo

{\ Displaystyle p (A) = \ det (AI_ {n} -A) = \ det (AA) = 0 ~.}

Hay muchas formas de ver por qué este argumento es incorrecto. Primero, en el teorema de Cayley-Hamilton, p ( A ) es una matriz n × n . Sin embargo, el lado derecho de la ecuación anterior es el valor de un determinante, que es un escalar . Por lo tanto, no se pueden equiparar a menos que n = 1 (es decir, A es solo un escalar). Segundo, en la expresión ${\ Displaystyle \ det (\ lambda I_ {n} -A)}$ , la variable λ realmente ocurre en las entradas diagonales de la matriz ${\ Displaystyle \ lambda I_ {n} -A}$ . Para ilustrar, considere el polinomio característico en el ejemplo anterior nuevamente:

{\ Displaystyle \ det {\ begin {pmatrix} \ lambda -1 & -2 \\ - 3 & \ lambda -4 \ end {pmatrix}}.}

Si se sustituye toda la matriz A por λ en esas posiciones, se obtiene

{\ displaystyle \ det {\ begin {pmatrix} {\ begin {pmatrix} 1 & 2 \\ 3 & 4 \ end {pmatrix}} - 1 & -2 \\ - 3 & {\ begin {pmatrix} 1 & 2 \\ 3 & 4 \ end {pmatrix} } -4 \ end {pmatrix}},}

en el que la expresión "matriz" simplemente no es válida. Sin embargo, tenga en cuenta que si se restan múltiplos escalares de matrices de identidad en lugar de escalares en lo anterior, es decir, si la sustitución se realiza como

{\ Displaystyle \ det {\ begin {pmatrix} {\ begin {pmatrix} 1 & 2 \\ 3 & 4 \ end {pmatrix}} - I_ {2} & - 2I_ {2} \\ - 3I_ {2} & {\ begin { pmatrix} 1 y 2 \\ 3 y 4 \ end {pmatrix}} - 4I_ {2} \ end {pmatrix}},}

entonces el determinante es de hecho cero, pero la matriz expandida en cuestión no evalúa a ${\ Displaystyle AI_ {n} -A}$ ; ni su determinante (un escalar) puede compararse con p ( A ) (una matriz). Entonces el argumento de que ${\ Displaystyle p (A) = \ det (AI_ {n} -A) = 0}$ todavía no se aplica.

En realidad, si dicho argumento es válido, también debería ser válido cuando se utilicen otras formas multilineales en lugar de determinantes. Por ejemplo, si consideramos la función permanente y definimos ${\ Displaystyle q (\ lambda) = \ operatorname {perm} (\ lambda I_ {n} -A)}$ , entonces por el mismo argumento, deberíamos poder "probar" que q ( A ) = 0. Pero esta afirmación es demostrablemente incorrecta. En el caso bidimensional, por ejemplo, la permanente de una matriz viene dada por

{\ Displaystyle \ operatorname {perm} {\ begin {pmatrix} a & b \\ c & d \ end {pmatrix}} = ad + bc.}

Entonces, para la matriz A en el ejemplo anterior,

{\ Displaystyle {\ begin {alineado} q (\ lambda) & = \ operatorname {perm} (\ lambda I_ {2} -A) = \ operatorname {perm} {\ begin {pmatrix} \ lambda -1 & -2 \ \ -3 & \ lambda -4 \ end {pmatrix}} \\ [6pt] & = (\ lambda -1) (\ lambda -4) + (- 2) (- 3) = \ lambda ^ {2} -5 \ lambda +10. \ end {alineado}}}

Sin embargo, se puede verificar que

{\ Displaystyle q (A) = A ^ {2} -5A + 10I_ {2} = 12I_ {2} \ not = 0.}

Una de las demostraciones del teorema de Cayley-Hamilton anterior tiene cierta similitud con el argumento de que ${\ Displaystyle p (A) = \ det (AI_ {n} -A) = 0}$ . Al introducir una matriz con coeficientes no numéricos, se puede dejar que A viva dentro de una entrada de la matriz, pero luego ${\ Displaystyle AI_ {n}}$ no es igual a A , y la conclusión se llega de manera diferente.

Pruebas usando métodos de álgebra abstracta

Propiedades básicas de las derivaciones de Hasse-Schmidt en el álgebra exterior ${\ Displaystyle A = \ bigwedge M}$ de algún módulo B M (supuestamente libre y de rango finito) han sido utilizados por Gatto y Salehyan (2016 , §4) para probar el teorema de Cayley-Hamilton. Véase también Gatto y Scherbak (2015) .

Abstracción y generalizaciones

Las demostraciones anteriores muestran que el teorema de Cayley-Hamilton es válido para matrices con entradas en cualquier anillo conmutativo R , y que p ( φ ) = 0 se mantendrá siempre que φ sea un endomorfismo de un módulo R generado por los elementos e ₁ , ..., e _n que satisface

{\ Displaystyle \ varphi (e_ {j}) = \ sum a_ {ij} e_ {i}, \ qquad j = 1, \ ldots, n.}

Esta versión más general del teorema es la fuente del célebre lema de Nakayama en álgebra conmutativa y geometría algebraica.

Ver también

Matriz complementaria

Observaciones

^ Debido a la naturaleza no conmutativa de la operación de multiplicación para cuaterniones y construcciones relacionadas, se debe tener cuidado con las definiciones, sobre todo en este contexto, para el determinante. El teorema es válido también para los cuaterniones divididos ligeramente menos bien comportados, ver Alagös, Oral & Yüce (2012) . Los anillos de cuaterniones y cuaterniones divididos se pueden representar ambos mediante ciertasmatrices complejas de $2 \times 2$ . (Cuando se restringen a la norma unitaria, estos son los grupos $SU (2)$ y $SU (1, 1)$ respectivamente.) Por lo tanto, no es sorprendente que el teorema sea válido.
No existe tal representación matricial para los octoniones , ya que la operación de multiplicación no es asociativa en este caso. Sin embargo, un teorema de Cayley-Hamilton modificado sigue siendo válido para los octoniones, véase Tian (2000) .
^ Una expresión explícita para estos coeficientes es
${\ Displaystyle c_ {i} = \ sum _ {k_ {1}, k_ {2}, \ ldots, k_ {n}} \ prod _ {l = 1} ^ {n} {\ frac {(-1) ^ {k_ {l} +1}} {l ^ {k_ {l}} k_ {l}!}} \ operatorname {tr} (A ^ {l}) ^ {k_ {l}},}$
donde la suma se toma sobre los conjuntos de todas las particiones enteras $k l \geq 0$ satisfaciendo la ecuación
${\ Displaystyle \ sum _ {l = 1} ^ {n} lk_ {l} = ni.}$
^ Ver, por ejemplo, p. 54 de Brown 1994 , que resuelve la fórmula de Jacobi ,
${\ estilo de visualización \ parcial p (\ lambda) / \ parcial \ lambda = p (\ lambda) \ sum _ {m = 0} ^ {\ infty} \ lambda ^ {- (m + 1)} \ operatorname {tr} A ^ {m} = p (\ lambda) ~ \ operatorname {tr} {\ frac {I} {\ lambda IA}} \ equiv \ operatorname {tr} B ~,}$
donde $B$ es la matriz adjunta de la siguiente sección. También existe un algoritmo recursivo relacionado equivalente introducido por Urbain Le Verrier y Dmitry Konstantinovich Faddeev , el algoritmo Faddeev-LeVerrier , que dice
${\ Displaystyle {\ begin {alineado} M_ {0} & \ equiv O & c_ {n} & = 1 \ qquad & (k = 0) \\ [5pt] M_ {k} & \ equiv AM_ {k-1} - {\ frac {1} {k-1}} (\ operatorname {tr} (AM_ {k-1})) I \ qquad \ qquad & c_ {nk} & = - {\ frac {1} {k}} \ nombre de operador {tr} (AM_ {k}) \ qquad & k = 1, \ ldots, n ~. \ end {alineado}}}$
(ver, p. ej., p. 88 de Gantmacher 1960 ). Observe $A -1 = - M n / c 0$ cuando termina la recursión. Vea la prueba algebraica en la siguiente sección, que se basa en los modos del adyuvante, $B k \equiv M n - k$ . Específicamente, ${\ Displaystyle (\ lambda IA) B = Ip (\ lambda)}$ y la derivada anterior de $p$ cuando se rastrea produce
${\ Displaystyle \ lambda p'-np = \ operatorname {tr} (AB) ~,}$ ( Hou 1998 ), y las recursiones anteriores, a su vez.

Notas

↑ a b Crilly, 1998
↑ a b Cayley 1858 , págs. 17–37
^ Cayley 1889 , págs. 475–496
^ a b Hamilton 1864a
^ a b Hamilton 1864b
↑ a b Hamilton, 1862
^ Atiyah y MacDonald 1969
^ Hamilton 1853 , p. 562
^ Zhang 1997
^ a b Frobenius 1878
^ Zeni y Rodrigues 1992
^ Barut, Zeni y Laufer 1994a
^ Barut, Zeni y Laufer 1994b
^ Laufer 1997
^ Curtright, Fairlie y Zachos 2014
^ Stein, William. Teoría algebraica de números, un enfoque computacional (PDF) . pag. 29.
^ Bhatia 1997 , p. 7
^ Garrett 2007 , p. 381

Referencias

Alagös, Y .; Oral, K .; Yüce, S. (2012). "Matrices de cuaterniones divididas" . Notas matemáticas de Miskolc . 13 (2): 223–232. doi : 10.18514 / MMN.2012.364 . ISSN 1787-2405 (acceso abierto)
Atiyah, MF ; MacDonald, IG (1969), Introducción al álgebra conmutativa , Westview Press, ISBN 978-0-201-40751-8
Barut, AO ; Zeni, JR; Laufer, A. (1994a). "El mapa exponencial para el grupo conforme O (2,4)". J. Phys. A: Matemáticas. Gen . 27 (15): 5239–5250. arXiv : hep-th / 9408105 . Código Bibliográfico : 1994JPhA ... 27.5239B . doi : 10.1088 / 0305-4470 / 27/15/022 .
Barut, AO ; Zeni, JR; Laufer, A. (1994b). "El mapa exponencial del grupo unitario SU (2,2)". J. Phys. A: Matemáticas. Gen . 27 (20): 6799–6806. arXiv : hep-th / 9408145 . Código Bibliográfico : 1994JPhA ... 27.6799B . doi : 10.1088 / 0305-4470 / 27/20/017 . S2CID 16495633 .
Bhatia, R. (1997). Análisis matricial . Textos de posgrado en matemáticas. 169 . Saltador. ISBN 978-0387948461.
Brown, Lowell S. (1994). Teoría cuántica de campos . Prensa de la Universidad de Cambridge . ISBN 978-0-521-46946-3.
Cayley, A. (1858). "Una memoria sobre la teoría de las matrices". Philos. Trans . 148 .
Cayley, A. (1889). Los artículos matemáticos recopilados de Arthur Cayley . (Reimpresión clásica). 2 . Libros olvidados. ASIN B008HUED9O .
Crilly, T. (1998). "El joven Arthur Cayley". Notas Rec. R. Soc. Lond . 52 (2): 267–282. doi : 10.1098 / rsnr.1998.0050 . S2CID 146669911 .
Curtright, TL ; Fairlie, DB ; Zachos, CK (2014). "Una fórmula compacta para rotaciones como polinomios de matriz de espín". SIGMA . 10 (2014): 084. arXiv : 1402.3541 . Código bibliográfico : 2014SIGMA..10..084C . doi : 10.3842 / SIGMA.2014.084 . S2CID 18776942 .
Frobenius, G. (1878). "Ueber lineare Substutionen und bilineare Formen". J. Reine Angew. Matemáticas . 1878 (84): 1–63. doi : 10.1515 / crll.1878.84.1 .
Gantmacher, FR (1960). La teoría de las matrices . Nueva York: Chelsea Publishing. ISBN 978-0-8218-1376-8.
Gatto, Letterio; Salehyan, Parham (2016), derivaciones de Hasse-Schmidt en álgebras de Grassmann , Springer, doi : 10.1007 / 978-3-319-31842-4 , ISBN 978-3-319-31842-4, MR 3524604
Gatto, Letterio; Scherbak, Inna (2015), Observaciones sobre el teorema de Cayley-Hamilton , arXiv : 1510.03022
Garrett, Paul B. (2007). Álgebra abstracta . Nueva York: Chapman y Hall / CRC. ISBN 978-1584886891.
Hamilton, WR (1853). Conferencias sobre cuaterniones . Dublín.
Hamilton, WR (1864a). "Sobre un método nuevo y general de invertir una función lineal y cuaternión de un cuaternión". Actas de la Real Academia Irlandesa . viii : 182-183. (comunicado el 9 de junio de 1862)
Hamilton, WR (1864b). "Sobre la Existencia de una Ecuación Simbólica y Bicuadrática, que es satisfecha por el Símbolo de Operación Lineal en Cuaterniones". Actas de la Real Academia Irlandesa . viii : 190-101. (comunicado el 23 de junio de 1862)
Hou, SH (1998). "Nota de clase: una prueba simple del algoritmo polinomial característico de Leverrier - Faddeev". Revisión SIAM . 40 (3): 706–709. Código bibliográfico : 1998SIAMR..40..706H . doi : 10.1137 / S003614459732076X . "Nota en el aula: una prueba simple del algoritmo polinomial característico de Leverrier-Faddeev"
Hamilton, WR (1862). "Sobre la Existencia de una Ecuación Simbólica y Bicuadrática que es satisfecha por el Símbolo de Operación Lineal o Distributiva en un Cuaternión" . The London, Edinburgh y Dublin Philosophical Magazine y Journal of Science . serie iv . 24 : 127-128. ISSN 1478-6435 . Consultado el 14 de febrero de 2015 .
Jefe de hogar, Alston S. (2006). La teoría de las matrices en el análisis numérico . Libros de Dover sobre matemáticas. ISBN 978-0486449722.
Laufer, A. (1997). "El mapa exponencial de GL (N)". J. Phys. A: Matemáticas. Gen . 30 (15): 5455–5470. arXiv : hep-th / 9604049 . Código bibliográfico : 1997JPhA ... 30.5455L . doi : 10.1088 / 0305-4470 / 30/15/029 . S2CID 10699434 .
Tian, Y. (2000). "Representaciones matriciales de octoniones y su aplicación". Avances en álgebras de Clifford aplicadas . 10 (1): 61–90. arXiv : matemáticas / 0003166 . CiteSeerX 10.1.1.237.2217 . doi : 10.1007 / BF03042010 . ISSN 0188-7009 . S2CID 14465054 .
Zeni, JR; Rodrigues, WA (1992). "Un estudio reflexivo de las transformaciones de Lorentz por álgebras de Clifford". En t. J. Mod. Phys. Una . 7 (8): 1793 págs. Bibcode : 1992IJMPA ... 7.1793Z . doi : 10.1142 / S0217751X92000776 .
Zhang, F. (1997). "Cuaterniones y matrices de cuaterniones" . Álgebra lineal y sus aplicaciones . 251 : 21–57. doi : 10.1016 / 0024-3795 (95) 00543-9 . ISSN 0024-3795 (archivo abierto).

enlaces externos

"Teorema de Cayley-Hamilton" , Enciclopedia de Matemáticas , EMS Press , 2001 [1994]
Una prueba de PlanetMath.
El teorema de Cayley-Hamilton en MathPages

[10] Debido a la naturaleza no conmutativa de la operación de multiplicación para cuaterniones y construcciones relacionadas, se debe tener cuidado con las definiciones, sobre todo en este contexto, para el determinante. El teorema es válido también para los cuaterniones divididos ligeramente menos bien comportados, ver Alagös, Oral & Yüce (2012) . Los anillos de cuaterniones y cuaterniones divididos se pueden representar ambos mediante ciertasmatrices complejas de $2 \times 2$ . (Cuando se restringen a la norma unitaria, estos son los grupos $SU (2)$ y $SU (1, 1)$ respectivamente.) Por lo tanto, no es sorprendente que el teorema sea válido.
No existe tal representación matricial para los octoniones , ya que la operación de multiplicación no es asociativa en este caso. Sin embargo, un teorema de Cayley-Hamilton modificado sigue siendo válido para los octoniones, véase Tian (2000) .

[12] Una expresión explícita para estos coeficientes es
${\ Displaystyle c_ {i} = \ sum _ {k_ {1}, k_ {2}, \ ldots, k_ {n}} \ prod _ {l = 1} ^ {n} {\ frac {(-1) ^ {k_ {l} +1}} {l ^ {k_ {l}} k_ {l}!}} \ operatorname {tr} (A ^ {l}) ^ {k_ {l}},}$
donde la suma se toma sobre los conjuntos de todas las particiones enteras $k l \geq 0$ satisfaciendo la ecuación
${\ Displaystyle \ sum _ {l = 1} ^ {n} lk_ {l} = ni.}$

[13] Ver, por ejemplo, p. 54 de Brown 1994 , que resuelve la fórmula de Jacobi ,
${\ estilo de visualización \ parcial p (\ lambda) / \ parcial \ lambda = p (\ lambda) \ sum _ {m = 0} ^ {\ infty} \ lambda ^ {- (m + 1)} \ operatorname {tr} A ^ {m} = p (\ lambda) ~ \ operatorname {tr} {\ frac {I} {\ lambda IA}} \ equiv \ operatorname {tr} B ~,}$
donde $B$ es la matriz adjunta de la siguiente sección. También existe un algoritmo recursivo relacionado equivalente introducido por Urbain Le Verrier y Dmitry Konstantinovich Faddeev , el algoritmo Faddeev-LeVerrier , que dice
${\ Displaystyle {\ begin {alineado} M_ {0} & \ equiv O & c_ {n} & = 1 \ qquad & (k = 0) \\ [5pt] M_ {k} & \ equiv AM_ {k-1} - {\ frac {1} {k-1}} (\ operatorname {tr} (AM_ {k-1})) I \ qquad \ qquad & c_ {nk} & = - {\ frac {1} {k}} \ nombre de operador {tr} (AM_ {k}) \ qquad & k = 1, \ ldots, n ~. \ end {alineado}}}$
(ver, p. ej., p. 88 de Gantmacher 1960 ). Observe $A -1 = - M n / c 0$ cuando termina la recursión. Vea la prueba algebraica en la siguiente sección, que se basa en los modos del adyuvante, $B k \equiv M n - k$ . Específicamente, ${\ Displaystyle (\ lambda IA) B = Ip (\ lambda)}$ y la derivada anterior de $p$ cuando se rastrea produce
${\ Displaystyle \ lambda p'-np = \ operatorname {tr} (AB) ~,}$ ( Hou 1998 ), y las recursiones anteriores, a su vez.

[Crilly_1-1] Crilly, 1998

[Cayley_1-2] Cayley 1858 , págs. 17–37

[3] Cayley 1889 , págs. 475–496

[Hamilton_1864a-4] Hamilton 1864a

[Hamilton_1864b-5] Hamilton 1864b

[Hamilton_1862-6] Hamilton, 1862

[7] Atiyah y MacDonald 1969

[Hamilton_1853-8] Hamilton 1853 , p. 562

[9] Zhang 1997

[Frobenius_1878-11] Frobenius 1878

[14] Zeni y Rodrigues 1992

[15] Barut, Zeni y Laufer 1994a

[16] Barut, Zeni y Laufer 1994b

[17] Laufer 1997

[18] Curtright, Fairlie y Zachos 2014

[19] Stein, William. Teoría algebraica de números, un enfoque computacional (PDF) . pag. 29.

[20] Bhatia 1997 , p. 7

[21] Garrett 2007 , p. 381

[1]