En álgebra lineal y análisis funcional , el teorema mínimo-máximo , o teorema variacional , o principio mínimo-máximo de Courant-Fischer-Weyl , es un resultado que da una caracterización variacional de valores propios de operadores hermitianos compactos en espacios de Hilbert . Puede verse como el punto de partida de muchos resultados de naturaleza similar.
Este artículo analiza primero el caso de dimensión finita y sus aplicaciones antes de considerar los operadores compactos en espacios de Hilbert de dimensión infinita. Veremos que para los operadores compactos, la demostración del teorema principal usa esencialmente la misma idea del argumento de dimensión finita.
En el caso de que el operador no sea hermitiano, el teorema proporciona una caracterización equivalente de los valores singulares asociados . El teorema mínimo-máximo se puede extender a los operadores autoadjuntos que están delimitados a continuación.
Matrices
Sea A una matriz hermitiana n × n . Al igual que con muchos otros resultados variacionales sobre valores propios, se considera el cociente de Rayleigh-Ritz R A : C n \ {0} → R definido por
donde (⋅, ⋅) denota el producto interior euclidiano en C n . Claramente, el cociente de Rayleigh de un vector propio es su valor propio asociado. De manera equivalente, el cociente de Rayleigh-Ritz se puede reemplazar por
Para matrices hermitianas, el rango de la función continua R A ( x ), o f ( x ), es un subconjunto compacto [ a , b ] de la línea real. El máximo by el mínimo a son el valor propio más grande y más pequeño de A , respectivamente. El teorema mínimo-máximo es un refinamiento de este hecho.
Teorema mínimo-máximo
Sea A una matriz hermitiana n × n con valores propios λ 1 ≤ ... ≤ λ k ≤ ... ≤ λ n entonces
y
En particular,
y estos límites se alcanzan cuando x es un vector propio de los valores propios apropiados.
Además, la formulación más simple para el valor propio máximo λ n viene dada por:
De manera similar, el valor propio mínimo λ 1 viene dado por:
Dado que la matriz A es hermitiana, es diagonalizable y podemos elegir una base ortonormal de autovectores { u 1 , ..., u n } es decir, u i es un autovector para el autovalor λ i y tal que ( u i , u i ) = 1 y ( u i , u j ) = 0 para todo i ≠ j .
Si U es un subespacio de dimensión k, entonces su intersección con el intervalo del subespacio { u k , ..., u n } no es cero (simplemente verificando las dimensiones) y, por lo tanto, existe un vector v ≠ 0 en esta intersección que puede escribir como
y cuyo cociente de Rayleigh es
(como todo para i = k, .., n) y por tanto
Dado que esto es cierto para todo U, podemos concluir que
Esta es una desigualdad. Para establecer la otra desigualdad, elija el espacio k-dimensional específico V = span { u 1 , ..., u k } , para el cual
porque es el valor propio más grande en V. Por lo tanto, también
En el caso de que U sea un subespacio de dimensión n-k + 1 , procedemos de manera similar: considere el subespacio de dimensión k , span { u 1 , ..., u k }. Su intersección con el subespacio U no es cero (simplemente verificando las dimensiones) y, por lo tanto, existe un vector v en esta intersección que podemos escribir como
y cuyo cociente de Rayleigh es
y por lo tanto
Dado que esto es cierto para todo U, podemos concluir que
Nuevamente, esta es una parte de la ecuación. Para obtener la otra desigualdad, observe nuevamente que el vector propio u deestá contenido en U = span { u k , ..., u n } para que podamos concluir la igualdad.
Contraejemplo en el caso no hermitiano
Sea N la matriz nilpotente
Definir el cociente de Rayleigh exactamente como arriba en el caso de Hermitian. Entonces es fácil ver que el único valor propio de N es cero, mientras que el valor máximo de la relación de Rayleigh es1/2. Es decir, el valor máximo del cociente de Rayleigh es mayor que el valor propio máximo.
Aplicaciones
Principio mínimo-máximo para valores singulares
Los valores singulares { σ k } de una matriz cuadrada M son las raíces cuadradas de los valores propios de M * M (equivalentemente MM * ). Una consecuencia inmediata [ cita requerida ] de la primera igualdad en el teorema mínimo-máximo es:
Similar,
Aquí denota la k- ésima entrada en la secuencia creciente de σ, de modo que.
Teorema de entrelazado de Cauchy
Sea A una matriz simétrica n × n . El m × m matriz B , donde m ≤ n , se llama una compresión de A si existe una proyección ortogonal P sobre un subespacio de dimensión m tal que PAP * = B . El teorema del entrelazado de Cauchy establece:
- Teorema. Si los valores propios de A son α 1 ≤ ... ≤ α n , y los de B son β 1 ≤ ... ≤ β j ≤ ... ≤ β m , entonces para todo j ≤ m ,
Esto se puede demostrar utilizando el principio mínimo-máximo. Deje β i he vector propio mantenido correspondencia b i y S j ser el j dimensional subespacio S j = Gen { b 1 , ..., b j }, entonces
Según la primera parte de min-max, α j ≤ β j . Por otro lado, si definimos S m - j +1 = span { b j , ..., b m }, entonces
donde la última desigualdad viene dada por la segunda parte de min-max.
Cuando n - m = 1 , tenemos α j ≤ β j ≤ α j +1 , de ahí el nombre de teorema de entrelazado .
Operadores compactos
Deje que A sea un compacto , hermitiana operador en un espacio de Hilbert H . Recuerde que el espectro de dicho operador (el conjunto de valores propios) es un conjunto de números reales cuyo único punto de agrupación posible es cero. Por tanto, es conveniente enumerar los valores propios positivos de A como
donde las entradas se repiten con multiplicidad , como en el caso de la matriz. (Para enfatizar que la secuencia es decreciente, podemos escribir.) Cuando H es de dimensión infinita, la secuencia anterior de valores propios es necesariamente infinita. Ahora aplicamos el mismo razonamiento que en el caso de la matriz. Dejando que S k ⊂ H sea un subespacio de k dimensiones, podemos obtener el siguiente teorema.
- Teorema (Mín-Máx). Sea A un operador compacto y autoadjunto en un espacio de Hilbert H , cuyos valores propios positivos se enumeran en orden decreciente ... ≤ λ k ≤ ... ≤ λ 1 . Luego:
Un par similar de igualdades se aplica a los valores propios negativos.
Sea S ' el cierre del tramo lineal. El subespacio S ' tiene codimensión k - 1. Por el mismo argumento de recuento de dimensiones que en el caso de la matriz, S' ∩ S k no está vacío. Entonces existe x ∈ S ' ∩ S k con. Dado que es un elemento de S ' , tal x necesariamente satisface
Por lo tanto, para todo S k
Pero A es compacto, por lo tanto, la función f ( x ) = ( Ax , x ) es débilmente continua. Además, cualquier conjunto acotado en H es débilmente compacto. Esto nos permite reemplazar el infimum por mínimo:
Entonces
Porque la igualdad se consigue cuando ,
Esta es la primera parte del teorema mínimo-máximo para operadores autoadjuntos compactos.
De manera análoga, considere ahora un subespacio ( k - 1) -dimensional S k −1 , cuyo complemento ortogonal se denota por S k −1 ⊥ . Si S ' = span { u 1 ... u k },
Entonces
Esto implica
donde se aplicó la compacidad de A. Indexar lo anterior por la colección de subespacios dimensionales k-1 da
Elija S k −1 = span { u 1 , ..., u k −1 } y deducimos
Operadores autoadjuntos
El teorema mínimo-máximo también se aplica a los operadores autoadjuntos (posiblemente ilimitados). [1] [2] Recuerde que el espectro esencial es el espectro sin valores propios aislados de multiplicidad finita. A veces tenemos algunos valores propios por debajo del espectro esencial y nos gustaría aproximar los valores propios y las funciones propias.
- Teorema (Mín-Máx). Sea A autoadjunto, y deje ser los valores propios de A por debajo del espectro esencial. Luego
.
Si solo tenemos N autovalores y, por lo tanto, nos quedamos sin autovalores, entonces dejamos(la parte inferior del espectro esencial) para n> N , y la declaración anterior se mantiene después de reemplazar min-max con inf-sup.
- Teorema (Max-Min). Sea A autoadjunto, y deje ser los valores propios de A por debajo del espectro esencial. Luego
.
Si solo tenemos N autovalores y, por lo tanto, nos quedamos sin autovalores, entonces dejamos(la parte inferior del espectro esencial) para n> N , y la declaración anterior se mantiene después de reemplazar max-min con sup-inf.
Las demostraciones [1] [2] utilizan los siguientes resultados sobre operadores autoadjuntos:
- Teorema. Sea A autoadjunto. Luego por si y solo si . [1] : 77
- Teorema. Si A es autoadjunto, entonces
y
. [1] : 77
Ver también
Referencias
- M. Reed y B. Simon, Métodos de Física Matemática Moderna IV: Análisis de Operadores , Academic Press, 1978.