Teorema mínimo-máximo

En álgebra lineal y análisis funcional , el teorema mínimo-máximo , o teorema variacional , o principio mínimo-máximo de Courant-Fischer-Weyl , es un resultado que da una caracterización variacional de valores propios de operadores hermitianos compactos en espacios de Hilbert . Puede verse como el punto de partida de muchos resultados de naturaleza similar.

Este artículo analiza primero el caso de dimensión finita y sus aplicaciones antes de considerar los operadores compactos en espacios de Hilbert de dimensión infinita. Veremos que para los operadores compactos, la demostración del teorema principal usa esencialmente la misma idea del argumento de dimensión finita.

En el caso de que el operador no sea hermitiano, el teorema proporciona una caracterización equivalente de los valores singulares asociados . El teorema mínimo-máximo se puede extender a los operadores autoadjuntos que están delimitados a continuación.

Matrices

Sea $A$ una matriz hermitiana $n \times n$ . Al igual que con muchos otros resultados variacionales sobre valores propios, se considera el cociente de Rayleigh-Ritz $R$ $A$ $:$ $C$ $n$ $\ {0} →$ $R$ definido por

{\ Displaystyle R_ {A} (x) = {\ frac {(Ax, x)} {(x, x)}}}

donde $(\cdot, \cdot)$ denota el producto interior euclidiano en $C n$ . Claramente, el cociente de Rayleigh de un vector propio es su valor propio asociado. De manera equivalente, el cociente de Rayleigh-Ritz se puede reemplazar por

{\ Displaystyle f (x) = (Ax, x), \; \ | x \ | = 1.}

Para matrices hermitianas, el rango de la función continua R _A ( x ), o f ( x ), es un subconjunto compacto [ a , b ] de la línea real. El máximo by el mínimo a son el valor propio más grande y más pequeño de A , respectivamente. El teorema mínimo-máximo es un refinamiento de este hecho.

Teorema mínimo-máximo

Sea $A$ una matriz hermitiana $n \times n$ con valores propios $λ$ $1$ $\leq ... \leq$ $λ$ $k$ $\leq ... \leq$ $λ$ $n$ entonces

{\ Displaystyle \ lambda _ {k} = \ min _ {U} \ {\ max _ {x} \ {R_ {A} (x) \ mid x \ in U {\ text {y}} x \ neq 0 \} \ mid \ dim (U) = k \}}

y

{\ Displaystyle \ lambda _ {k} = \ max _ {U} \ {\ min _ {x} \ {R_ {A} (x) \ mid x \ in U {\ text {y}} x \ neq 0 \} \ mid \ dim (U) = n-k + 1 \}}

En particular,

{\ Displaystyle \ lambda _ {1} \ leq R_ {A} (x) \ leq \ lambda _ {n} \ quad \ forall x \ in \ mathbf {C} ^ {n} \ backslash \ {0 \}}

y estos límites se alcanzan cuando $x$ es un vector propio de los valores propios apropiados.

Además, la formulación más simple para el valor propio máximo λ _n viene dada por:

{\ Displaystyle \ lambda _ {n} = \ max \ {R_ {A} (x): x \ neq 0 \}.}

De manera similar, el valor propio mínimo λ ₁ viene dado por:

{\ Displaystyle \ lambda _ {1} = \ min \ {R_ {A} (x): x \ neq 0 \}.}

Prueba -

Dado que la matriz $A$ es hermitiana, es diagonalizable y podemos elegir una base ortonormal de autovectores { u ₁ , ..., u _n } es decir, u _i es un autovector para el autovalor λ _i y tal que ( u _i , u _i ) = 1 y ( u _i , u _j ) = 0 para todo i ≠ j .

Si U es un subespacio de dimensión k, entonces su intersección con el $intervalo$ del subespacio ${$ $u$ $k$ $, ...,$ $u$ $n$ $}$ no es cero (simplemente verificando las dimensiones) y, por lo tanto, existe un vector $v \neq 0$ en esta intersección que puede escribir como

{\ Displaystyle v = \ sum _ {i = k} ^ {n} \ alpha _ {i} u_ {i}}

y cuyo cociente de Rayleigh es

{\ Displaystyle R_ {A} (v) = {\ frac {\ sum _ {i = k} ^ {n} \ lambda _ {i} \ alpha _ {i} ^ {2}} {\ sum _ {i = k} ^ {n} \ alpha _ {i} ^ {2}}} \ geq \ lambda _ {k}}

(como todo ${\ Displaystyle \ lambda _ {i} \ geq \ lambda _ {k}}$ para i = k, .., n) y por tanto

{\ Displaystyle \ max \ {R_ {A} (x) \ mid x \ in U \} \ geq \ lambda _ {k}}

Dado que esto es cierto para todo U, podemos concluir que

{\ Displaystyle \ min \ {\ max \ {R_ {A} (x) \ mid x \ in U {\ text {y}} x \ neq 0 \} \ mid \ dim (U) = k \} \ geq \ lambda _ {k}}

Esta es una desigualdad. Para establecer la otra desigualdad, elija el espacio k-dimensional específico $V = span {u 1, ..., u k}$ , para el cual

{\ Displaystyle \ max \ {R_ {A} (x) \ mid x \ in V {\ text {y}} x \ neq 0 \} \ leq \ lambda _ {k}}

porque ${\ Displaystyle \ lambda _ {k}}$ es el valor propio más grande en V. Por lo tanto, también

{\ Displaystyle \ min \ {\ max \ {R_ {A} (x) \ mid x \ in U {\ text {y}} x \ neq 0 \} \ mid \ dim (U) = k \} \ leq \ lambda _ {k}}

En el caso de que U sea un subespacio de dimensión n-k + 1 , procedemos de manera similar: considere el subespacio de dimensión k , $span {u 1, ..., u k}.$ Su intersección con el subespacio U no es cero (simplemente verificando las dimensiones) y, por lo tanto, existe un vector v en esta intersección que podemos escribir como

{\ Displaystyle v = \ sum _ {i = 1} ^ {k} \ alpha _ {i} u_ {i}}

y cuyo cociente de Rayleigh es

{\ Displaystyle R_ {A} (v) = {\ frac {\ sum _ {i = 1} ^ {k} \ lambda _ {i} \ alpha _ {i} ^ {2}} {\ sum _ {i = 1} ^ {k} \ alpha _ {i} ^ {2}}} \ leq \ lambda _ {k}}

y por lo tanto

{\ Displaystyle \ min \ {R_ {A} (x) \ mid x \ in U \} \ leq \ lambda _ {k}}

Dado que esto es cierto para todo U, podemos concluir que

{\ Displaystyle \ max \ {\ min \ {R_ {A} (x) \ mid x \ in U {\ text {y}} x \ neq 0 \} \ mid \ dim (U) = n-k + 1 \} \ leq \ lambda _ {k}}

Nuevamente, esta es una parte de la ecuación. Para obtener la otra desigualdad, observe nuevamente que el vector propio u de ${\ Displaystyle \ lambda _ {k}}$ está contenido en $U = span {u k, ..., u n}$ para que podamos concluir la igualdad.

Contraejemplo en el caso no hermitiano

Sea N la matriz nilpotente

{\ displaystyle {\ begin {bmatrix} 0 & 1 \\ 0 & 0 \ end {bmatrix}}.}

Definir el cociente de Rayleigh ${\ Displaystyle R_ {N} (x)}$ exactamente como arriba en el caso de Hermitian. Entonces es fácil ver que el único valor propio de N es cero, mientras que el valor máximo de la relación de Rayleigh es $1 / 2$ . Es decir, el valor máximo del cociente de Rayleigh es mayor que el valor propio máximo.

Aplicaciones

Principio mínimo-máximo para valores singulares

Los valores singulares { σ _k } de una matriz cuadrada M son las raíces cuadradas de los valores propios de M * M (equivalentemente MM * ). Una consecuencia inmediata ^{[ cita requerida ]} de la primera igualdad en el teorema mínimo-máximo es:

{\ Displaystyle \ sigma _ {k} ^ {\ uparrow} = \ min _ {S: \ dim (S) = k} \ max _ {x \ in S, \ | x \ | = 1} (M ^ { *} Mx, x) ^ {\ frac {1} {2}} = \ min _ {S: \ dim (S) = k} \ max _ {x \ en S, \ | x \ | = 1} \ | Mx \ |.}

Similar,

{\ Displaystyle \ sigma _ {k} ^ {\ uparrow} = \ max _ {S: \ dim (S) = n-k + 1} \ min _ {x \ in S, \ | x \ | = 1} \ | Mx \ |.}

Aquí ${\ Displaystyle \ sigma _ {k} = \ sigma _ {k} ^ {\ uparrow}}$ denota la k- ^ésima entrada en la secuencia creciente de σ, de modo que ${\ Displaystyle \ sigma _ {1} \ leq \ sigma _ {2} \ leq \ cdots}$ .

Teorema de entrelazado de Cauchy

Sea $A$ una matriz simétrica n × n . El m × m matriz B , donde m ≤ n , se llama una compresión de $A$ si existe una proyección ortogonal P sobre un subespacio de dimensión m tal que PAP * = B . El teorema del entrelazado de Cauchy establece:

Teorema. Si los valores propios de

A

son

α 1 \leq ... \leq α n

, y los de B son

β 1 \leq ... \leq β j \leq ... \leq β m

, entonces para todo

j \leq m

,

{\ Displaystyle \ alpha _ {j} \ leq \ beta _ {j} \ leq \ alpha _ {n-m + j}.}

Esto se puede demostrar utilizando el principio mínimo-máximo. Deje β _i he vector propio mantenido correspondencia b _i y S _j ser el j dimensional subespacio $S j = Gen {b 1, ..., b j},$ entonces

{\ Displaystyle \ beta _ {j} = \ max _ {x \ in S_ {j}, \ | x \ | = 1} (Bx, x) = \ max _ {x \ in S_ {j}, \ | x \ | = 1} (PAP ^ {*} x, x) \ geq \ min _ {S_ {j}} \ max _ {x \ in S_ {j}, \ | x \ | = 1} (A ( P ^ {*} x), P ^ {*} x) = \ alpha _ {j}.}

Según la primera parte de min-max, $α j \leq β j .$ Por otro lado, si definimos $S m - j +1 = span {b j, ..., b m},$ entonces

{\ Displaystyle \ beta _ {j} = \ min _ {x \ en S_ {m-j + 1}, \ | x \ | = 1} (Bx, x) = \ min _ {x \ en S_ {m -j + 1}, \ | x \ | = 1} (PAP ^ {*} x, x) = \ min _ {x \ en S_ {m-j + 1}, \ | x \ | = 1} ( A (P ^ {*} x), P ^ {*} x) \ leq \ alpha _ {n-m + j},}

donde la última desigualdad viene dada por la segunda parte de min-max.

Cuando $n - m = 1$ , tenemos $α j \leq β j \leq α j +1$ , de ahí el nombre de teorema de entrelazado .

Operadores compactos

Deje que $A$ sea un compacto , hermitiana operador en un espacio de Hilbert H . Recuerde que el espectro de dicho operador (el conjunto de valores propios) es un conjunto de números reales cuyo único punto de agrupación posible es cero. Por tanto, es conveniente enumerar los valores propios positivos de $A$ como

{\ Displaystyle \ cdots \ leq \ lambda _ {k} \ leq \ cdots \ leq \ lambda _ {1},}

donde las entradas se repiten con multiplicidad , como en el caso de la matriz. (Para enfatizar que la secuencia es decreciente, podemos escribir ${\ Displaystyle \ lambda _ {k} = \ lambda _ {k} ^ {\ downarrow}}$ .) Cuando H es de dimensión infinita, la secuencia anterior de valores propios es necesariamente infinita. Ahora aplicamos el mismo razonamiento que en el caso de la matriz. Dejando que S _k ⊂ H sea un subespacio de k dimensiones, podemos obtener el siguiente teorema.

Teorema (Mín-Máx). Sea

A

un operador compacto y autoadjunto en un espacio de Hilbert

H

, cuyos valores propios positivos se enumeran en orden decreciente

... \leq λ k \leq ... \leq λ 1

. Luego:

{\ Displaystyle {\ begin {alineado} \ max _ {S_ {k}} \ min _ {x \ in S_ {k}, \ | x \ | = 1} (Ax, x) & = \ lambda _ {k } ^ {\ flecha hacia abajo}, \\\ min _ {S_ {k-1}} \ max _ {x \ in S_ {k-1} ^ {\ perp}, \ | x \ | = 1} (Ax, x) & = \ lambda _ {k} ^ {\ flecha hacia abajo}. \ end {alineado}}}

Un par similar de igualdades se aplica a los valores propios negativos.

Prueba -

Sea S ' el cierre del tramo lineal ${\ Displaystyle S '= \ operatorname {span} \ {u_ {k}, u_ {k + 1}, \ ldots \}}$ . El subespacio S ' tiene codimensión k - 1. Por el mismo argumento de recuento de dimensiones que en el caso de la matriz, S' ∩ S _k no está vacío. Entonces existe x ∈ S ' ∩ S _k con ${\ Displaystyle \ | x \ | = 1}$ . Dado que es un elemento de S ' , tal x necesariamente satisface

{\ Displaystyle (Ax, x) \ leq \ lambda _ {k}.}

Por lo tanto, para todo S _k

{\ Displaystyle \ inf _ {x \ in S_ {k}, \ | x \ | = 1} (Ax, x) \ leq \ lambda _ {k}}

Pero $A$ es compacto, por lo tanto, la función f ( x ) = ( Ax , x ) es débilmente continua. Además, cualquier conjunto acotado en H es débilmente compacto. Esto nos permite reemplazar el infimum por mínimo:

{\ Displaystyle \ min _ {x \ in S_ {k}, \ | x \ | = 1} (Ax, x) \ leq \ lambda _ {k}.}

Entonces

{\ Displaystyle \ sup _ {S_ {k}} \ min _ {x \ in S_ {k}, \ | x \ | = 1} (Ax, x) \ leq \ lambda _ {k}.}

Porque la igualdad se consigue cuando ${\ Displaystyle S_ {k} = \ operatorname {span} \ {u_ {1}, \ ldots, u_ {k} \}}$ ,

{\ Displaystyle \ max _ {S_ {k}} \ min _ {x \ in S_ {k}, \ | x \ | = 1} (Ax, x) = \ lambda _ {k}.}

Esta es la primera parte del teorema mínimo-máximo para operadores autoadjuntos compactos.

De manera análoga, considere ahora un subespacio $(k - 1)$ -dimensional S _{k −1} , cuyo complemento ortogonal se denota por S _{k −1}^⊥ . Si S ' = span { u ₁ ... u _k },

{\ Displaystyle S '\ cap S_ {k-1} ^ {\ perp} \ neq {0}.}

Entonces

{\ Displaystyle \ existe x \ en S_ {k-1} ^ {\ perp} \, \ | x \ | = 1, (Ax, x) \ geq \ lambda _ {k}.}

Esto implica

{\ Displaystyle \ max _ {x \ in S_ {k-1} ^ {\ perp}, \ | x \ | = 1} (Ax, x) \ geq \ lambda _ {k}}

donde se aplicó la compacidad de A. Indexar lo anterior por la colección de subespacios dimensionales k-1 da

{\ Displaystyle \ inf _ {S_ {k-1}} \ max _ {x \ in S_ {k-1} ^ {\ perp}, \ | x \ | = 1} (Ax, x) \ geq \ lambda _ {k}.}

Elija S _{k −1} = span { u ₁ , ..., u _{k −1} } y deducimos

{\ Displaystyle \ min _ {S_ {k-1}} \ max _ {x \ in S_ {k-1} ^ {\ perp}, \ | x \ | = 1} (Ax, x) = \ lambda _ {k}.}

Operadores autoadjuntos

El teorema mínimo-máximo también se aplica a los operadores autoadjuntos (posiblemente ilimitados). ^[1]^[2] Recuerde que el espectro esencial es el espectro sin valores propios aislados de multiplicidad finita. A veces tenemos algunos valores propios por debajo del espectro esencial y nos gustaría aproximar los valores propios y las funciones propias.

Teorema (Mín-Máx). Sea A autoadjunto, y deje

{\ Displaystyle E_ {1} \ leq E_ {2} \ leq E_ {3} \ leq \ cdots}

ser los valores propios de A por debajo del espectro esencial. Luego

${\ Displaystyle E_ {n} = \ min _ {\ psi _ {1}, \ ldots, \ psi _ {n}} \ max \ {\ langle \ psi, A \ psi \ rangle: \ psi \ in \ operatorname {intervalo} (\ psi _ {1}, \ ldots, \ psi _ {n}), \, \ | \ psi \ | = 1 \}}$ .

Si solo tenemos N autovalores y, por lo tanto, nos quedamos sin autovalores, entonces dejamos ${\ Displaystyle E_ {n}: = \ inf \ sigma _ {ess} (A)}$ (la parte inferior del espectro esencial) para n> N , y la declaración anterior se mantiene después de reemplazar min-max con inf-sup.

Teorema (Max-Min). Sea A autoadjunto, y deje

{\ Displaystyle E_ {1} \ leq E_ {2} \ leq E_ {3} \ leq \ cdots}

ser los valores propios de A por debajo del espectro esencial. Luego

${\ Displaystyle E_ {n} = \ max _ {\ psi _ {1}, \ ldots, \ psi _ {n-1}} \ min \ {\ langle \ psi, A \ psi \ rangle: \ psi \ perp \ psi _ {1}, \ ldots, \ psi _ {n-1}, \, \ | \ psi \ | = 1 \}}$ .

Si solo tenemos N autovalores y, por lo tanto, nos quedamos sin autovalores, entonces dejamos ${\ Displaystyle E_ {n}: = \ inf \ sigma _ {ess} (A)}$ (la parte inferior del espectro esencial) para n> N , y la declaración anterior se mantiene después de reemplazar max-min con sup-inf.

Las demostraciones ^[1]^[2] utilizan los siguientes resultados sobre operadores autoadjuntos:

Teorema. Sea A autoadjunto. Luego

{\ Displaystyle (AE) \ geq 0}

por

{\ Displaystyle E \ in \ mathbb {R}}

si y solo si

{\ Displaystyle \ sigma (A) \ subseteq [E, \ infty)}

. ^[1]^{: 77}

Teorema. Si A es autoadjunto, entonces

${\ Displaystyle \ inf \ sigma (A) = \ inf _ {\ psi \ in {\ mathfrak {D}} (A), \ | \ psi \ | = 1} \ langle \ psi, A \ psi \ rangle}$

y

${\ Displaystyle \ sup \ sigma (A) = \ sup _ {\ psi \ in {\ mathfrak {D}} (A), \ | \ psi \ | = 1} \ langle \ psi, A \ psi \ rangle}$ . ^[1]^{: 77}

Ver también

Referencias

^ ^a ^b ^c ^d G. Teschl, Métodos matemáticos en mecánica cuántica (GSM 99) https://www.mat.univie.ac.at/~gerald/ftp/book-schroe/schroe.pdf
^ ^a ^b Lieb; Pérdida (2001). Análisis . GSM. 14 (2ª ed.). Providencia: Sociedad Matemática Estadounidense. ISBN 0-8218-2783-9.

M. Reed y B. Simon, Métodos de Física Matemática Moderna IV: Análisis de Operadores , Academic Press, 1978.

[teschl-1] G. Teschl, Métodos matemáticos en mecánica cuántica (GSM 99) https://www.mat.univie.ac.at/~gerald/ftp/book-schroe/schroe.pdf

[lieb-loss-2] Lieb; Pérdida (2001). Análisis . GSM. 14 (2ª ed.). Providencia: Sociedad Matemática Estadounidense. ISBN 0-8218-2783-9.

[1]