En álgebra lineal , el teorema de Cayley-Hamilton (llamado así por los matemáticos Arthur Cayley y William Rowan Hamilton ) establece que cada matriz cuadrada sobre un anillo conmutativo (como el campo real o complejo ) satisface su propia ecuación característica .
Si A es una matriz n × n dada e I n es la matriz identidad n × n , entonces el polinomio característico de A se define como [7] , donde det es la operación determinante y λ es una variable para un elemento escalar del anillo base. Dado que las entradas de la matrizson polinomios (lineales o constantes) en λ , el determinante es también un polinomio mónico de n -ésimo orden en λ , Se puede crear un polinomio análogo en la matriz A en lugar de la variable escalar λ , definida comoEl teorema de Cayley-Hamilton establece que este polinomio da como resultado la matriz cero , es decir, que. El teorema permite A n a ser expresada como una combinación lineal de las potencias de matriz inferiores de A . Cuando el anillo es un campo, el teorema de Cayley-Hamilton es equivalente a la afirmación de que el polinomio mínimo de una matriz cuadrada divide su polinomio característico. El teorema fue probado por primera vez en 1853 [8] en términos de inversas de funciones lineales de cuaterniones , un anillo no conmutativo , por Hamilton. [4] [5] [6] Esto corresponde al caso especial de ciertas matrices 4 × 4 reales o 2 × 2 complejas. El teorema es válido para matrices cuaterniónicas generales. [9] [nb 1] Cayley en 1858 lo declaró para matrices de 3 × 3 y más pequeñas, pero solo publicó una prueba para el caso de 2 × 2 . [2] El caso general fue probado por primera vez por Ferdinand Frobenius en 1878. [10]
Ejemplos de
Matrices 1 × 1
Para una matriz de 1 × 1 A = ( a 1,1 ) , el polinomio característico está dado por p (λ) = λ - a , por lo que p ( A ) = ( a ) - a 1,1 = 0 es trivial.
Matrices 2 × 2
Como ejemplo concreto, dejemos
Su polinomio característico viene dado por
El teorema de Cayley-Hamilton afirma que, si definimos
luego
Podemos verificar por cálculo que, de hecho,
Para una matriz genérica de 2 × 2 ,
el polinomio característico está dado por p ( λ ) = λ 2 - ( a + d ) λ + ( ad - bc ) , por lo que el teorema de Cayley-Hamilton establece que
lo cual es siempre el caso, evidente al calcular las entradas de A 2 .
Aplicaciones
Matriz determinante e inversa
Para una matriz A invertible general n × n , es decir, una con un determinante distinto de cero, A −1 se puede escribir como una expresión polinomial de ( n - 1) -ésimo orden en A : Como se indicó, el teorema de Cayley-Hamilton equivale a identidad
Los coeficientes c i son dadas por los polinomios simétricos elementales de los valores propios de A . Usando las identidades de Newton , los polinomios simétricos elementales pueden a su vez expresarse en términos de polinomios simétricos de suma de potencia de los valores propios:
donde tr ( A k ) es la traza de la matriz A k . Por lo tanto, podemos expresar c i en términos de la traza de potencias de A .
En general, la fórmula para los coeficientes c i se da en términos de polinomios de Bell exponenciales completos como [nb 2]
En particular, el determinante de A es igual a (-1) n c 0 . Por lo tanto, el determinante se puede escribir como la identidad de seguimiento :
Asimismo, el polinomio característico se puede escribir como
y, al multiplicar ambos lados por A −1 (nota - (- 1) n = (−1) n −1 ), uno es llevado a una expresión para el inverso de A como una identidad de traza,
Otro método para obtener estos coeficientes c k para una matriz general n × n , siempre que ninguna raíz sea cero, se basa en la siguiente expresión alternativa para el determinante ,
Por tanto, en virtud de la serie Mercator ,
donde la exponencial sólo necesita expandirse al orden λ - n , ya que p ( λ ) es de orden n , las potencias negativas netas de λ desaparecen automáticamente por el teorema C – H. (Nuevamente, esto requiere un anillo que contenga los números racionales). La diferenciación de esta expresión con respecto a λ permite expresar los coeficientes del polinomio característico para n general como determinantes de matrices m × m , [nb 3]
- Ejemplos de
Por ejemplo, los primeros polinomios de Bell son B 0 = 1, B 1 ( x 1 ) = x 1 , B 2 ( x 1 , x 2 ) = x2
1+ x 2 y B 3 ( x 1 , x 2 , x 3 ) = x3
1+ 3 x 1 x 2 + x 3 .
Utilizándolos para especificar los coeficientes c i del polinomio característico de una matriz de 2 × 2 se obtiene
El coeficiente c 0 da el determinante de la matriz 2 × 2 , c 1 menos su traza, mientras que su inverso está dado por
Se desprende de la fórmula general para c n-k , expresada en términos de polinomios de Bell, que las expresiones
Siempre dé los coeficientes c n −1 de λ n −1 y c n −2 de λ n −2 en el polinomio característico de cualquier matriz n × n , respectivamente. Entonces, para una matriz A de 3 × 3 , el enunciado del teorema de Cayley-Hamilton también se puede escribir como
donde el lado derecho designa una matriz de 3 × 3 con todas las entradas reducidas a cero. Asimismo, este determinante en el caso n = 3 , ahora es
Esta expresión da el negativo del coeficiente c n −3 de λ n −3 en el caso general, como se ve a continuación.
De manera similar, se puede escribir para una matriz A de 4 × 4 ,
donde, ahora, el determinante es c n −4 ,
y así sucesivamente para matrices más grandes. Las expresiones cada vez más complejas para los coeficientes c k son deducibles de las identidades de Newton o del algoritmo de Faddeev-LeVerrier .
n -ésima potencia de la matriz
El teorema de Cayley-Hamilton siempre proporciona una relación entre las potencias de A (aunque no siempre la más simple), lo que permite simplificar expresiones que involucran tales potencias y evaluarlas sin tener que calcular la potencia A n o potencias superiores de A .
Como ejemplo, para el teorema da
Luego, para calcular A 4 , observe
Igualmente,
Observe que hemos podido escribir la potencia de la matriz como la suma de dos términos. De hecho, la potencia matricial de cualquier orden k se puede escribir como un polinomio matricial de grado como máximo n - 1 , donde n es el tamaño de una matriz cuadrada. Este es un caso en el que el teorema de Cayley-Hamilton se puede utilizar para expresar una función matricial, que analizaremos a continuación de forma sistemática.
Funciones de matriz
Dada una función analítica
y el polinomio característico p ( x ) de grado n de una matriz A n × n , la función se puede expresar usando división larga como
donde q ( x ) es un polinomio cociente y r ( x ) es un polinomio restante tal que 0 ≤ grados r ( x ) < n .
Según el teorema de Cayley-Hamilton, al reemplazar x por la matriz A se obtiene p ( A ) = 0 , por lo que se tiene
Por tanto, la función analítica de la matriz A se puede expresar como un polinomio matricial de grado menor que n .
Sea el polinomio restante
Dado que p ( λ ) = 0 , la evaluación de la función f ( x ) en los n valores propios de A , produce
Esto equivale a un sistema de n ecuaciones lineales, que se pueden resolver para determinar los coeficientes c i . Por lo tanto, uno tiene
Cuando se repiten los valores propios, es decir, λ i = λ j para algunos i ≠ j , dos o más ecuaciones son idénticas; y, por tanto, las ecuaciones lineales no se pueden resolver de forma única. En tales casos, para un valor propio λ con multiplicidad m , las primeras m - 1 derivadas de p (x) desaparecen en el valor propio. Esto conduce a las soluciones adicionales linealmente independientes m - 1
lo cual, combinado con otros, produce las n ecuaciones requeridas para resolver c i .
Encontrar un polinomio que pase por los puntos ( λ i , f ( λ i )) es esencialmente un problema de interpolación y se puede resolver utilizando técnicas de interpolación de Lagrange o Newton , lo que lleva a la fórmula de Sylvester .
Por ejemplo, suponga que la tarea es encontrar la representación polinomial de
El polinomio característico es p ( x ) = ( x - 1) ( x - 3) = x 2 - 4 x + 3 , y los valores propios son λ = 1, 3 . Sea r ( x ) = c 0 + c 1 x . Evaluación de f ( λ) = r ( λ ) en los valores propios, se obtiene dos ecuaciones lineales, e t = c 0 + c 1 y e 3 t = c 0 + 3 c 1 .
Resolver las ecuaciones produce c 0 = (3 e t - e 3 t ) / 2 y c 1 = ( e 3 t - e t ) / 2 . Por tanto, se sigue que
Si, en cambio, la función fuera f ( A ) = sin At , entonces los coeficientes habrían sido c 0 = (3 sin t - sin 3 t ) / 2 y c 1 = (sin 3 t - sin t ) / 2 ; por eso
Como otro ejemplo, al considerar
entonces el polinomio característico es p ( x ) = x 2 + 1 , y los valores propios son λ = ± i .
Como antes, la evaluación de la función en los valores propios nos da la lineal ecuaciones e es = C 0 + ic 1 y e - que = c 0 - ic 1 ; cuya solución da, c 0 = ( e it + e - it ) / 2 = cos t y c 1 = ( e it - e - it ) / 2 i = sin t . Por lo tanto, para este caso,
que es una matriz de rotación .
Ejemplos estándar de tal uso es el mapa exponencial del álgebra de Lie de una matriz de grupo de Lie en el grupo. Está dado por una matriz exponencial ,
Tales expresiones se conocen desde hace mucho tiempo para SU (2) ,
donde σ son las matrices de Pauli y para SO (3) ,
que es la fórmula de rotación de Rodrigues . Para la notación, vea el grupo de rotación SO (3) # Una nota sobre álgebra de Lie .
Más recientemente, han aparecido expresiones para otros grupos, como el grupo de Lorentz SO (3, 1) , [11] O (4, 2) [12] y SU (2, 2) , [13] así como GL ( n , R ) . [14] El grupo O (4, 2) es el grupo conforme del espacio-tiempo , SU (2, 2) su cubierta simplemente conectada (para ser precisos, la cubierta simplemente conectada del componente conectado SO + (4, 2) de O (4, 2) ). Las expresiones obtenidas se aplican a la representación estándar de estos grupos. Requieren conocimiento de (algunos de) los valores propios de la matriz para exponenciar. Para SU (2) (y por tanto para SO (3) ), se han obtenido expresiones cerradas para todas las representaciones irreducibles, es decir, de cualquier espín. [15]
Teoría algebraica de números
El teorema de Cayley-Hamilton es una herramienta eficaz para calcular el polinomio mínimo de números enteros algebraicos. Por ejemplo, dada una extensión finita de y un entero algebraico que es una combinación lineal distinta de cero de la podemos calcular el polinomio mínimo de encontrando una matriz que represente el -transformación lineal
Si llamamos a esta matriz de transformación , entonces podemos encontrar el polinomio mínimo aplicando el teorema de Cayley-Hamilton a . [dieciséis]
Pruebas
El teorema de Cayley-Hamilton es una consecuencia inmediata de la existencia de la forma normal de Jordan para matrices sobre campos algebraicamente cerrados . En esta sección, se presentan pruebas directas.
Como muestran los ejemplos anteriores, obtener el enunciado del teorema de Cayley-Hamilton para una matriz n × n
requiere dos pasos: primero, los coeficientes c i del polinomio característico se determinan mediante el desarrollo como un polinomio en t del determinante
y luego estos coeficientes se utilizan en una combinación lineal de potencias de A que se equipara a la matriz nula n × n :
El lado izquierdo se puede calcular en una matriz n × n cuyas entradas son expresiones polinomiales (enormes) en el conjunto de entradas a i , j de A , por lo que el teorema de Cayley-Hamilton establece que cada una de estas n 2 expresiones es igual a 0 . Para cualquier valor fijo de n , estas identidades pueden obtenerse mediante manipulaciones algebraicas tediosas pero sencillas. Sin embargo, ninguno de estos cálculos puede mostrar por qué el teorema de Cayley-Hamilton debería ser válido para matrices de todos los tamaños posibles n , por lo que se necesita una prueba uniforme para todo n .
Preliminares
Si un vector v de tamaño n es un vector propio de A con valor propio λ , en otras palabras, si A ⋅ v = λv , entonces
que es el vector nulo ya que p ( λ ) = 0 (los valores propios de A son precisamente las raíces de p ( t ) ). Esto es válido para todos los valores propios posibles λ , por lo que las dos matrices igualadas por el teorema ciertamente dan el mismo resultado (nulo) cuando se aplican a cualquier vector propio. Ahora bien, si A admite una base de vectores propios, en otras palabras, si A es diagonalizable , entonces el teorema de Cayley-Hamilton debe ser válido para A , ya que dos matrices que dan los mismos valores cuando se aplican a cada elemento de una base deben ser iguales.
- producto de valores propios de
Considere ahora la función que mapas matrices para matrices dadas por la fórmula , es decir, que toma una matriz y lo inserta en su propio polinomio característico. No todas las matrices son diagonalizables, pero para matrices con coeficientes complejos, muchas de ellas son: el conjunto deLas matrices cuadradas complejas diagonalizables de un tamaño dado son densas en el conjunto de todas estas matrices cuadradas [17] (para que una matriz sea diagonalizable es suficiente, por ejemplo, que su polinomio característico no tenga raíces múltiples). Ahora visto como una función(ya que las matrices tienen entradas) vemos que esta función es continua . Esto es cierto porque las entradas de la imagen de una matriz están dadas por polinomios en las entradas de la matriz. Desde
y desde el set es densa, por continuidad esta función debe mapear el conjunto completo de matrices a la matriz cero. Por lo tanto, el teorema de Cayley-Hamilton es cierto para números complejos y, por lo tanto, también debe aplicarse- o -matrices valoradas.
Si bien esto proporciona una prueba válida, el argumento no es muy satisfactorio, ya que las identidades representadas por el teorema no dependen de ninguna manera de la naturaleza de la matriz (diagonalizable o no), ni del tipo de entradas permitidas (para matrices con entradas reales, las diagonalizables no forman un conjunto denso, y parece extraño que uno tenga que considerar matrices complejas para ver que el teorema de Cayley-Hamilton es válido para ellas). Por lo tanto, consideraremos ahora sólo los argumentos que prueban el teorema directamente para cualquier matriz utilizando únicamente manipulaciones algebraicas; estos también tienen la ventaja de trabajar para matrices con entradas en cualquier anillo conmutativo .
Existe una gran variedad de tales demostraciones del teorema de Cayley-Hamilton, de las cuales se darán varias aquí. Varían en la cantidad de nociones algebraicas abstractas necesarias para comprender la demostración. Las demostraciones más simples usan solo las nociones necesarias para formular el teorema (matrices, polinomios con entradas numéricas, determinantes), pero involucran cálculos técnicos que hacen algo misterioso el hecho de que conducen precisamente a la conclusión correcta. Es posible evitar tales detalles, pero al precio de involucrar nociones algebraicas más sutiles: polinomios con coeficientes en un anillo no conmutativo o matrices con tipos de entradas inusuales.
Matrices adyuvadas
Todas las demostraciones siguientes usan la noción de matriz adjunta adj ( M ) de una matriz M n × n , la transpuesta de su matriz cofactor .
Esta es una matriz cuyos coeficientes están dados por expresiones polinómicas en los coeficientes de M (de hecho, por ciertos ( n - 1) × ( n - 1) determinantes), de tal manera que se cumplen las siguientes relaciones fundamentales,
Estas relaciones son una consecuencia directa de las propiedades básicas de los determinantes: la evaluación de la entrada ( i , j ) del producto matricial de la izquierda da la expansión por la columna j del determinante de la matriz obtenido de M reemplazando la columna i por una copia de la columna j , que es det ( M ) si i = j y cero en caso contrario; el producto matricial de la derecha es similar, pero para expansiones por filas.
Siendo una consecuencia de la manipulación de expresiones algebraicas, estas relaciones son válidas para matrices con entradas en cualquier anillo conmutativo (se debe suponer conmutatividad para que los determinantes se definan en primer lugar). Es importante señalar esto aquí, porque estas relaciones se aplicarán a continuación para matrices con entradas no numéricas como polinomios.
Una prueba algebraica directa
Esta demostración utiliza exactamente el tipo de objetos necesarios para formular el teorema de Cayley-Hamilton: matrices con polinomios como entradas. La matriz t I n - A cuyo determinante es el polinomio característico de A es una matriz de este tipo, y dado que los polinomios forman un anillo conmutativo, tiene un adyuvante
Entonces, de acuerdo con la relación fundamental de la mano derecha del adjugado, uno tiene
Dado que B también es una matriz con polinomios en t como entradas, uno puede, para cada i , recopilar los coeficientes de t i en cada entrada para formar una matriz B i de números, de modo que se tenga
(La forma en que se definen las entradas de B deja en claro que no se producen potencias superiores a t n −1 ). Si bien esto parece un polinomio con matrices como coeficientes, no consideraremos tal noción; es solo una forma de escribir una matriz con entradas polinomiales como una combinación lineal de n matrices constantes, y el coeficiente t i se ha escrito a la izquierda de la matriz para enfatizar este punto de vista.
Ahora, uno puede expandir el producto de la matriz en nuestra ecuación por bilinealidad
Escritura
se obtiene una igualdad de dos matrices con entradas polinómicas, escritas como combinaciones lineales de matrices constantes con potencias de t como coeficientes.
Tal igualdad sólo puede ser válida si en cualquier posición de la matriz la entrada que se multiplica por una potencia dada t i es la misma en ambos lados; se sigue que las matrices constantes con coeficiente t i en ambas expresiones deben ser iguales. Escribiendo estas ecuaciones entonces para i desde n hasta 0, uno encuentra
Finalmente, multiplique la ecuación de los coeficientes de t i de la izquierda por A i , y sume:
Los lados izquierdos forman una suma telescópica y se cancelan por completo; los lados derechos suman:
Esto completa la prueba.
Una demostración usando polinomios con coeficientes matriciales
Esta demostración es similar a la primera, pero trata de darle sentido a la noción de polinomio con coeficientes matriciales que fue sugerida por las expresiones que ocurren en esa demostración. Esto requiere un cuidado considerable, ya que es algo inusual considerar polinomios con coeficientes en un anillo no conmutativo, y no todos los razonamientos que son válidos para polinomios conmutativos pueden aplicarse en esta configuración.
En particular, mientras que la aritmética de polinomios sobre un anillo conmutativo modela la aritmética de funciones polinomiales , este no es el caso sobre un anillo no conmutativo (de hecho, no existe una noción obvia de función polinomial en este caso que se cierra con la multiplicación). Entonces, cuando se consideran polinomios en t con coeficientes de matriz, la variable t no debe considerarse como una "desconocida", sino como un símbolo formal que debe manipularse de acuerdo con reglas dadas; en particular, no se puede simplemente establecer t en un valor específico.
Dejar ser el anillo de matrices con entradas en algún anillo R (como los números reales o complejos) que tiene A como elemento. Matrices con polinomios de coeficientes en t , comoo su adjunto B en la primera prueba, son elementos de.
Al recopilar potencias similares de t , tales matrices se pueden escribir como "polinomios" en t con matrices constantes como coeficientes; escribirpara el conjunto de tales polinomios. Dado que este conjunto está en biyección con, uno define las operaciones aritméticas en él correspondientemente, en particular la multiplicación viene dada por
respetar el orden de las matrices de coeficientes de los dos operandos; obviamente esto da una multiplicación no conmutativa.
Por tanto, la identidad
de la primera prueba puede verse como una que implica una multiplicación de elementos en .
En este punto, es tentador simplemente establecer t igual a la matriz A , lo que hace que el primer factor de la izquierda sea igual a la matriz nula y el lado derecho sea igual a p ( A ) ; sin embargo, esta no es una operación permitida cuando los coeficientes no se conmutan. Es posible definir un "mapa de evaluación de la derecha" ev A : M [ t ] → M , que reemplaza cada t i por la potencia matricial A i de A , donde se estipula que la potencia siempre se debe multiplicar por la derecha al coeficiente correspondiente.
Pero este mapa no es un homomorfismo de anillo: la evaluación correcta de un producto difiere en general del producto de las evaluaciones correctas. Esto es así porque la multiplicación de polinomios con coeficientes matriciales no modela la multiplicación de expresiones que contienen incógnitas: un productose define suponiendo que t conmuta con N , pero esto puede fallar si t se sustituye por la matriz A .
Se puede solucionar esta dificultad en la situación particular en cuestión, ya que el mapa de evaluación de la derecha anterior se convierte en un homomorfismo de anillo si la matriz A está en el centro del anillo de coeficientes, de modo que conmuta con todos los coeficientes de los polinomios. (el argumento que demuestra esto es sencillo, exactamente porque el desplazamiento t con coeficientes ahora se justifica después de la evaluación).
Ahora, A no siempre está en el centro de M , pero podemos reemplazar M con un anillo más pequeño siempre que contenga todos los coeficientes de los polinomios en cuestión:, A , y los coeficientesdel polinomio B . La elección obvia para tal subanillo es el centralizador Z de A , el subanillo de todas las matrices que conmutan con A ; por definición A está en el centro de Z .
Este centralizador obviamente contiene , y A , pero hay que demostrar que contiene las matrices. Para hacer esto, se combinan las dos relaciones fundamentales para los adjuntos, escribiendo el adjugado B como un polinomio:
La equiparación de los coeficientes muestra que para cada i , tenemos A B i = B i A como se desea. Habiendo encontrado el escenario adecuado en el que ev A es de hecho un homomorfismo de anillos, se puede completar la demostración como se sugirió anteriormente:
Esto completa la prueba.
Una síntesis de las dos primeras pruebas.
En la primera prueba, uno pudo determinar los coeficientes B i de B basados en la relación fundamental de la derecha para el adjugado solamente. De hecho, las primeras n ecuaciones derivadas pueden interpretarse como la determinación del cociente B de la división euclidiana del polinomio p ( t ) I n de la izquierda por el polinomio mónico I n t - A , mientras que la ecuación final expresa el hecho de que el el resto es cero. Esta división se realiza en el anillo de polinomios con coeficientes matriciales. De hecho, incluso a través de un anillo no conmutativo, la división euclidiana por un polinomio mónico P se define, y siempre produce un cociente único y resto con la misma condición grado como en el caso conmutativa, siempre que se especifica en la que un lado desea P a ser un factor (aquí que está a la izquierda).
Para ver que el cociente y el resto son únicos (que es la parte importante del enunciado aquí), basta con escribir como y observe que dado que P es mónico, P (Q − Q ') no puede tener un grado menor que el de P , a menos que Q = Q' .
Pero el dividendo p ( t ) I n y el divisor I n t - A usados aquí se encuentran en el subanillo ( R [ A ]) [ t ] , donde R [ A ] es el subanillo del anillo matriz M ( n , R ) generada por una : el R lapso -linear de todos los poderes de una . Por lo tanto, la división euclidiana se puede realizar dentro de ese anillo polinomial conmutativo y, por supuesto, da el mismo cociente B y el resto 0 que en el anillo más grande; en particular, esto muestra que B de hecho se encuentra en ( R [ A ]) [ t ] .
Pero, en esta configuración conmutativa, es válido establecer t en A en la ecuación
es decir, aplicar el mapa de evaluación
que es un homomorfismo de anillo, dando
al igual que en la segunda prueba, como se desee.
Además de probar el teorema, el argumento anterior nos dice que los coeficientes B i de B son polinomios en A , mientras que de la segunda prueba solo sabíamos que se encuentran en el centralizador Z de A ; en general, Z es un subanillo más grande que R [ A ] , y no necesariamente conmutativo. En particular, el término constante B 0 = adj (- A ) se encuentra en R [ A ] . Dado que A es una matriz cuadrada arbitraria, esto prueba que adj ( A ) siempre se puede expresar como un polinomio en A (con coeficientes que dependen de A ) .
De hecho, las ecuaciones encontradas en la primera demostración permiten expresar sucesivamente como polinomios en A , lo que conduce a la identidad
válido para todas las matrices n × n , donde
es el polinomio característico de A .
Tenga en cuenta que esta identidad también implica el enunciado del teorema de Cayley-Hamilton: uno puede mover adj (- A ) al lado derecho, multiplicar la ecuación resultante (a la izquierda o a la derecha) por A , y usar el hecho de que
Una prueba usando matrices de endomorfismos.
Como se mencionó anteriormente, la matriz p ( A ) enunciado del teorema se obtiene evaluando primero el determinante y luego sustituyendo t por la matriz A ; haciendo esa sustitución en la matrizantes de evaluar el determinante no es significativo. Sin embargo, es posible dar una interpretación donde p ( A ) se obtiene directamente como el valor de un determinado determinante, pero esto requiere un ajuste más complicado, uno de matrices sobre un anillo en el que se pueden interpretar tanto las entradasde A , y todo de A en sí. Se podría tomar para esto el anillo M ( n , R ) de n × n matrices sobre R , donde la entrada se realiza como y A como él mismo. Pero considerar matrices con matrices como entradas puede causar confusión con matrices de bloque , lo cual no se pretende, ya que da una noción incorrecta de determinante (recuerde que el determinante de una matriz se define como una suma de productos de sus entradas, y en el caso de una matriz de bloques, esto generalmente no es lo mismo que la suma correspondiente de productos de sus bloques). Es más claro distinguir A del endomorfismo φ de un espacio vectorial n- dimensional V (o módulo R libre si R no es un campo) definido por él en una base, y tomar matrices sobre el extremo del anillo ( V ) de todos esos endomorfismos. Entonces φ ∈ End ( V ) es una posible entrada de la matriz, mientras que A designa el elemento de M ( n , End ( V )) cuya entrada i , j es el endomorfismo de la multiplicación escalar por; similarse interpretará como elemento de M ( n , End ( V )). Sin embargo, dado que End ( V ) no es un anillo conmutativo, no se define ningún determinante en M ( n , End ( V )); esto solo se puede hacer para matrices sobre un subanillo conmutativo de End ( V ). Ahora las entradas de la matriztodos se encuentran en el subanillo R [ φ ] generado por la identidad y φ , que es conmutativo. Entonces se define un mapa determinante M ( n , R [ φ ]) → R [ φ ], yevalúa el valor p ( φ ) del polinomio característico de A en φ (esto se mantiene independientemente de la relación entre A y φ ); el teorema de Cayley-Hamilton establece que p ( φ ) es el endomorfismo nulo.
De esta forma, la siguiente prueba puede obtenerse de la de (Atiyah & MacDonald 1969 , Prop. 2.4) (que de hecho es el enunciado más general relacionado con el lema de Nakayama ; uno toma como ideal en esa proposición el anillo completo R ). El hecho de que A sea la matriz de φ en la base e 1 , ..., e n significa que
Se pueden interpretar como n componentes de una ecuación en V n , cuyos miembros se pueden escribir usando el producto matriz-vector M ( n , End ( V )) × V n → V n que se define como de costumbre, pero con entradas individuales ψ ∈ El final ( V ) y v en V se "multiplica" formando; esto da:
dónde es el elemento cuyo componente i es e i (en otras palabras, es la base e 1 , ..., e n de V escrito como una columna de vectores). Escribiendo esta ecuación como
uno reconoce la transposición de la matrizconsiderado anteriormente, y su determinante (como elemento de M ( n , R [ φ ])) también es p ( φ ). Para derivar de esta ecuación que p ( φ ) = 0 ∈ Fin ( V ), uno a la izquierda se multiplica por la matriz adjunta de, que se define en el anillo de matriz M ( n , R [ φ ]), dando
la asociatividad de la multiplicación matriz-matriz y matriz-vector utilizada en el primer paso es una propiedad puramente formal de esas operaciones, independiente de la naturaleza de las entradas. Ahora el componente i de esta ecuación dice que p ( φ ) ( e i ) = 0 ∈ V ; así p ( φ ) desaparece en todo e i , y dado que estos elementos generan V, se sigue que p ( φ ) = 0 ∈ End ( V ), completando la demostración.
Un hecho adicional que se sigue de esta demostración es que la matriz A cuyo polinomio característico se toma no necesita ser idéntica al valor φ sustituido en ese polinomio; basta que φ sea un endomorfismo de V que satisfaga las ecuaciones iniciales
para alguna secuencia de elementos e 1 , ..., e n que generan V (cuyo espacio podría tener una dimensión menor que n , o en caso de que el anillo R no sea un campo, podría no ser un módulo libre en absoluto).
Una "prueba" falsa: p ( A ) = det ( AI n - A ) = det ( A - A ) = 0
Un argumento persistente elemental pero incorrecto [18] para el teorema es "simplemente" tomar la definición
y sustituir A por λ , obteniendo
Hay muchas formas de ver por qué este argumento es incorrecto. Primero, en el teorema de Cayley-Hamilton, p ( A ) es una matriz n × n . Sin embargo, el lado derecho de la ecuación anterior es el valor de un determinante, que es un escalar . Por lo tanto, no se pueden equiparar a menos que n = 1 (es decir, A es solo un escalar). Segundo, en la expresión, la variable λ realmente ocurre en las entradas diagonales de la matriz . Para ilustrar, considere el polinomio característico en el ejemplo anterior nuevamente:
Si se sustituye toda la matriz A por λ en esas posiciones, se obtiene
en el que la expresión "matriz" simplemente no es válida. Sin embargo, tenga en cuenta que si se restan múltiplos escalares de matrices de identidad en lugar de escalares en lo anterior, es decir, si la sustitución se realiza como
entonces el determinante es de hecho cero, pero la matriz expandida en cuestión no evalúa a ; ni su determinante (un escalar) puede compararse con p ( A ) (una matriz). Entonces el argumento de que todavía no se aplica.
En realidad, si dicho argumento es válido, también debería ser válido cuando se utilicen otras formas multilineales en lugar de determinantes. Por ejemplo, si consideramos la función permanente y definimos, entonces por el mismo argumento, deberíamos poder "probar" que q ( A ) = 0. Pero esta afirmación es demostrablemente incorrecta. En el caso bidimensional, por ejemplo, la permanente de una matriz viene dada por
Entonces, para la matriz A en el ejemplo anterior,
Sin embargo, se puede verificar que
Una de las demostraciones del teorema de Cayley-Hamilton anterior tiene cierta similitud con el argumento de que . Al introducir una matriz con coeficientes no numéricos, se puede dejar que A viva dentro de una entrada de la matriz, pero luegono es igual a A , y la conclusión se llega de manera diferente.
Pruebas usando métodos de álgebra abstracta
Propiedades básicas de las derivaciones de Hasse-Schmidt en el álgebra exterior de algún módulo B M (supuestamente libre y de rango finito) han sido utilizados por Gatto y Salehyan (2016 , §4) para probar el teorema de Cayley-Hamilton. Véase también Gatto y Scherbak (2015) .
Abstracción y generalizaciones
Las demostraciones anteriores muestran que el teorema de Cayley-Hamilton es válido para matrices con entradas en cualquier anillo conmutativo R , y que p ( φ ) = 0 se mantendrá siempre que φ sea un endomorfismo de un módulo R generado por los elementos e 1 , ..., e n que satisface
Esta versión más general del teorema es la fuente del célebre lema de Nakayama en álgebra conmutativa y geometría algebraica.
Ver también
- Matriz complementaria
Observaciones
- ^ Debido a la naturaleza no conmutativa de la operación de multiplicación para cuaterniones y construcciones relacionadas, se debe tener cuidado con las definiciones, sobre todo en este contexto, para el determinante. El teorema es válido también para los cuaterniones divididos ligeramente menos bien comportados, ver Alagös, Oral & Yüce (2012) . Los anillos de cuaterniones y cuaterniones divididos se pueden representar ambos mediante ciertasmatrices complejas de 2 × 2 . (Cuando se restringen a la norma unitaria, estos son los grupos SU (2) y SU (1, 1) respectivamente.) Por lo tanto, no es sorprendente que el teorema sea válido.
No existe tal representación matricial para los octoniones , ya que la operación de multiplicación no es asociativa en este caso. Sin embargo, un teorema de Cayley-Hamilton modificado sigue siendo válido para los octoniones, véase Tian (2000) . - ^ Una expresión explícita para estos coeficientes es
- ^ Ver, por ejemplo, p. 54 de Brown 1994 , que resuelve la fórmula de Jacobi ,
- ( Hou 1998 ), y las recursiones anteriores, a su vez.
Notas
- ↑ a b Crilly, 1998
- ↑ a b Cayley 1858 , págs. 17–37
- ^ Cayley 1889 , págs. 475–496
- ^ a b Hamilton 1864a
- ^ a b Hamilton 1864b
- ↑ a b Hamilton, 1862
- ^ Atiyah y MacDonald 1969
- ^ Hamilton 1853 , p. 562
- ^ Zhang 1997
- ^ a b Frobenius 1878
- ^ Zeni y Rodrigues 1992
- ^ Barut, Zeni y Laufer 1994a
- ^ Barut, Zeni y Laufer 1994b
- ^ Laufer 1997
- ^ Curtright, Fairlie y Zachos 2014
- ^ Stein, William. Teoría algebraica de números, un enfoque computacional (PDF) . pag. 29.
- ^ Bhatia 1997 , p. 7
- ^ Garrett 2007 , p. 381
Referencias
- Alagös, Y .; Oral, K .; Yüce, S. (2012). "Matrices de cuaterniones divididas" . Notas matemáticas de Miskolc . 13 (2): 223–232. doi : 10.18514 / MMN.2012.364 . ISSN 1787-2405 (acceso abierto)
- Atiyah, MF ; MacDonald, IG (1969), Introducción al álgebra conmutativa , Westview Press, ISBN 978-0-201-40751-8
- Barut, AO ; Zeni, JR; Laufer, A. (1994a). "El mapa exponencial para el grupo conforme O (2,4)". J. Phys. A: Matemáticas. Gen . 27 (15): 5239–5250. arXiv : hep-th / 9408105 . Código Bibliográfico : 1994JPhA ... 27.5239B . doi : 10.1088 / 0305-4470 / 27/15/022 .
- Barut, AO ; Zeni, JR; Laufer, A. (1994b). "El mapa exponencial del grupo unitario SU (2,2)". J. Phys. A: Matemáticas. Gen . 27 (20): 6799–6806. arXiv : hep-th / 9408145 . Código Bibliográfico : 1994JPhA ... 27.6799B . doi : 10.1088 / 0305-4470 / 27/20/017 . S2CID 16495633 .
- Bhatia, R. (1997). Análisis matricial . Textos de posgrado en matemáticas. 169 . Saltador. ISBN 978-0387948461.
- Brown, Lowell S. (1994). Teoría cuántica de campos . Prensa de la Universidad de Cambridge . ISBN 978-0-521-46946-3.
- Cayley, A. (1858). "Una memoria sobre la teoría de las matrices". Philos. Trans . 148 .
- Cayley, A. (1889). Los artículos matemáticos recopilados de Arthur Cayley . (Reimpresión clásica). 2 . Libros olvidados. ASIN B008HUED9O .
- Crilly, T. (1998). "El joven Arthur Cayley". Notas Rec. R. Soc. Lond . 52 (2): 267–282. doi : 10.1098 / rsnr.1998.0050 . S2CID 146669911 .
- Curtright, TL ; Fairlie, DB ; Zachos, CK (2014). "Una fórmula compacta para rotaciones como polinomios de matriz de espín". SIGMA . 10 (2014): 084. arXiv : 1402.3541 . Código bibliográfico : 2014SIGMA..10..084C . doi : 10.3842 / SIGMA.2014.084 . S2CID 18776942 .
- Frobenius, G. (1878). "Ueber lineare Substutionen und bilineare Formen". J. Reine Angew. Matemáticas . 1878 (84): 1–63. doi : 10.1515 / crll.1878.84.1 .
- Gantmacher, FR (1960). La teoría de las matrices . Nueva York: Chelsea Publishing. ISBN 978-0-8218-1376-8.
- Gatto, Letterio; Salehyan, Parham (2016), derivaciones de Hasse-Schmidt en álgebras de Grassmann , Springer, doi : 10.1007 / 978-3-319-31842-4 , ISBN 978-3-319-31842-4, MR 3524604
- Gatto, Letterio; Scherbak, Inna (2015), Observaciones sobre el teorema de Cayley-Hamilton , arXiv : 1510.03022
- Garrett, Paul B. (2007). Álgebra abstracta . Nueva York: Chapman y Hall / CRC. ISBN 978-1584886891.
- Hamilton, WR (1853). Conferencias sobre cuaterniones . Dublín.
- Hamilton, WR (1864a). "Sobre un método nuevo y general de invertir una función lineal y cuaternión de un cuaternión". Actas de la Real Academia Irlandesa . viii : 182-183. (comunicado el 9 de junio de 1862)
- Hamilton, WR (1864b). "Sobre la Existencia de una Ecuación Simbólica y Bicuadrática, que es satisfecha por el Símbolo de Operación Lineal en Cuaterniones". Actas de la Real Academia Irlandesa . viii : 190-101. (comunicado el 23 de junio de 1862)
- Hou, SH (1998). "Nota de clase: una prueba simple del algoritmo polinomial característico de Leverrier - Faddeev". Revisión SIAM . 40 (3): 706–709. Código bibliográfico : 1998SIAMR..40..706H . doi : 10.1137 / S003614459732076X . "Nota en el aula: una prueba simple del algoritmo polinomial característico de Leverrier-Faddeev"
- Hamilton, WR (1862). "Sobre la Existencia de una Ecuación Simbólica y Bicuadrática que es satisfecha por el Símbolo de Operación Lineal o Distributiva en un Cuaternión" . The London, Edinburgh y Dublin Philosophical Magazine y Journal of Science . serie iv . 24 : 127-128. ISSN 1478-6435 . Consultado el 14 de febrero de 2015 .
- Jefe de hogar, Alston S. (2006). La teoría de las matrices en el análisis numérico . Libros de Dover sobre matemáticas. ISBN 978-0486449722.
- Laufer, A. (1997). "El mapa exponencial de GL (N)". J. Phys. A: Matemáticas. Gen . 30 (15): 5455–5470. arXiv : hep-th / 9604049 . Código bibliográfico : 1997JPhA ... 30.5455L . doi : 10.1088 / 0305-4470 / 30/15/029 . S2CID 10699434 .
- Tian, Y. (2000). "Representaciones matriciales de octoniones y su aplicación". Avances en álgebras de Clifford aplicadas . 10 (1): 61–90. arXiv : matemáticas / 0003166 . CiteSeerX 10.1.1.237.2217 . doi : 10.1007 / BF03042010 . ISSN 0188-7009 . S2CID 14465054 .
- Zeni, JR; Rodrigues, WA (1992). "Un estudio reflexivo de las transformaciones de Lorentz por álgebras de Clifford". En t. J. Mod. Phys. Una . 7 (8): 1793 págs. Bibcode : 1992IJMPA ... 7.1793Z . doi : 10.1142 / S0217751X92000776 .
- Zhang, F. (1997). "Cuaterniones y matrices de cuaterniones" . Álgebra lineal y sus aplicaciones . 251 : 21–57. doi : 10.1016 / 0024-3795 (95) 00543-9 . ISSN 0024-3795 (archivo abierto).
enlaces externos
- "Teorema de Cayley-Hamilton" , Enciclopedia de Matemáticas , EMS Press , 2001 [1994]
- Una prueba de PlanetMath.
- El teorema de Cayley-Hamilton en MathPages