Teorema de mercer

En matemáticas , específicamente análisis funcional , el teorema de Mercer es una representación de una función definida positiva simétrica en un cuadrado como una suma de una secuencia convergente de funciones producto. Este teorema, presentado en ( Mercer 1909 ), es uno de los resultados más notables del trabajo de James Mercer (1883-1932). Es una herramienta teórica importante en la teoría de ecuaciones integrales ; se utiliza en la teoría espacial de Hilbert de procesos estocásticos , por ejemplo, el teorema de Karhunen-Loève ; y también se utiliza para caracterizar un núcleo semidefinido positivo simétrico. ^[1]

Introducción

Para explicar el teorema de Mercer , primero consideramos un caso especial importante; ver más abajo para una formulación más general. Un kernel , en este contexto, es una función continua simétrica

{\ Displaystyle K: [a, b] \ times [a, b] \ rightarrow \ mathbb {R}}

donde simétrico significa que K ( x , s ) = K ( s , x ).

Se dice que K es definida no negativa (o semidefinida positiva ) si y solo si

{\ Displaystyle \ sum _ {i = 1} ^ {n} \ sum _ {j = 1} ^ {n} K (x_ {i}, x_ {j}) c_ {i} c_ {j} \ geq 0 }

para todas las secuencias finitas de puntos x ₁ , ..., x _n de [ a , b ] y todas las opciones de números reales c ₁ , ..., c _n (cf. núcleo definido positivo ).

Asociado a K hay un operador lineal (más específicamente un operador integral de Hilbert-Schmidt ) en funciones definidas por la integral

{\ Displaystyle [T_ {K} \ varphi] (x) = \ int _ {a} ^ {b} K (x, s) \ varphi (s) \, ds.}

Por consideraciones técnicas asumimos ${\ Displaystyle \ varphi}$ puede variar a través del espacio L ² [ a , b ] (ver espacio Lp ) de funciones de valor real integrables al cuadrado. Desde T _K es un operador lineal, podemos hablar de valores propios y funciones propias de T _K .

Teorema . Suponga que K es un núcleo definido no negativo simétrico continuo. Entonces hay una base ortonormal { e _i } _i de L ² [ a , b ] que consta de funciones propias de T _{K de} manera que la secuencia correspondiente de valores propios {λ _i } _i no es negativa. Las funciones propias correspondientes a valores propios distintos de cero son continuas en [ a , b ] y K tiene la representación

{\ Displaystyle K (s, t) = \ sum _ {j = 1} ^ {\ infty} \ lambda _ {j} \, e_ {j} (s) \, e_ {j} (t)}

donde la convergencia es absoluta y uniforme.

Detalles

Ahora explicamos con mayor detalle la estructura de la demostración del teorema de Mercer, particularmente cómo se relaciona con la teoría espectral de operadores compactos .

El mapa K → T _K es inyectivo .
T _K es un operador compacto simétrico no negativo en L ² [ a , b ]; además K ( x , x ) ≥ 0.

Para mostrar compacidad, demuestre que la imagen de la bola unitaria de L ² [ a , b ] bajo T _{K es} equicontinua y aplique el teorema de Ascoli , para mostrar que la imagen de la bola unitaria es relativamente compacta en C ([ a , b ]) con la norma uniforme y a fortiori en L ² [ a , b ].

Ahora aplique el teorema espectral para operadores compactos en espacios de Hilbert a T _K para mostrar la existencia de la base ortonormal { e _i } _i de L ² [ a , b ]

{\ Displaystyle \ lambda _ {i} e_ {i} (t) = [T_ {K} e_ {i}] (t) = \ int _ {a} ^ {b} K (t, s) e_ {i } (s) \, ds.}

Si λ _i ≠ 0, se considera que el vector propio ( función propia ) e _i es continuo en [ a , b ]. Ahora

{\ Displaystyle \ sum _ {i = 1} ^ {\ infty} \ lambda _ {i} | e_ {i} (t) e_ {i} (s) | \ leq \ sup _ {x \ in [a, b]} | K (x, x) |,}

que muestra que la secuencia

{\ Displaystyle \ sum _ {i = 1} ^ {\ infty} \ lambda _ {i} e_ {i} (t) e_ {i} (s)}

converge absolutamente y uniformemente a un núcleo K ₀ que se ve fácilmente para definir el mismo operador que el núcleo K . Por tanto, K = K ₀ de donde se sigue el teorema de Mercer.

Finalmente, para mostrar la no negatividad de los valores propios, se puede escribir ${\ Displaystyle \ lambda \ langle f, f \ rangle = \ langle f, T_ {K} f \ rangle}$ y expresar el lado derecho como una integral bien aproximada por sus sumas de Riemann, que no son negativas por la definición positiva de K , lo que implica ${\ Displaystyle \ lambda \ langle f, f \ rangle \ geq 0}$ , Insinuando ${\ Displaystyle \ lambda \ geq 0}$ .

Rastro

Lo siguiente es inmediato:

Teorema . Suponga que K es un núcleo definido no negativo simétrico continuo; T _K tiene una secuencia de valores propios no negativos {λ _i } _i . Luego

{\ Displaystyle \ int _ {a} ^ {b} K (t, t) \, dt = \ sum _ {i} \ lambda _ {i}.}

Esto muestra que el operador T _K es un operador de clase de rastreo y

{\ Displaystyle \ operatorname {trace} (T_ {K}) = \ int _ {a} ^ {b} K (t, t) \, dt.}

Generalizaciones

El teorema de Mercer en sí mismo es una generalización del resultado de que cualquier matriz simétrica semidefinida positiva es la matriz de Gramian de un conjunto de vectores.

La primera generalización ^{[ citación necesaria ]} reemplaza el intervalo [ a , b ] con cualquier espacio de Hausdorff compacto y medida de Lebesgue en [ un , b ] se sustituye por un finito numerable aditivo medida μ en el álgebra de Borel de X cuyo soporte es X . Este μ medios que ( U )> 0 para cualquier subconjunto abierto no vacío U de X .

Una generalización reciente ^{[ cita requerida ]} reemplaza estas condiciones por lo siguiente: el conjunto X es un primer espacio topológico contable dotado de una medida Borel (completa) μ. X es el soporte de μ y, para todo x en X , hay un conjunto abierto U que contiene x y tiene una medida finita. Entonces, esencialmente, el mismo resultado se mantiene:

Teorema . Supongamos que K es un núcleo definida positiva simétrica continua en X . Si la función κ es L ¹_μ ( X ), donde κ (x) = K (x, x), para todo x en X , entonces hay un conjunto ortonormal { e _i } _i de L ²_μ ( X ) que consiste de funciones propias de T _{K de} modo que la secuencia correspondiente de valores propios {λ _i } _i no sea negativa. Las funciones propias correspondientes a valores propios distintos de cero son continuas en X y K tiene la representación

{\ Displaystyle K (s, t) = \ sum _ {j = 1} ^ {\ infty} \ lambda _ {j} \, e_ {j} (s) \, e_ {j} (t)}

donde la convergencia es absoluta y uniforme sobre subconjuntos compactos de X .

La siguiente generalización ^{[ cita requerida ] se} ocupa de las representaciones de núcleos medibles .

Sea ( X , M , μ) un espacio de medida σ-finito. Un núcleo L ² (o integrable en cuadrado) en X es una función

{\ Displaystyle K \ in L _ {\ mu \ otimes \ mu} ^ {2} (X \ times X).}

Los núcleos L ² definen un operador acotado T _K por la fórmula

{\ Displaystyle \ langle T_ {K} \ varphi, \ psi \ rangle = \ int _ {X \ times X} K (y, x) \ varphi (y) \ psi (x) \, d [\ mu \ otimes \ mu] (y, x).}

T _K es un operador compacto (en realidad es incluso un operador de Hilbert-Schmidt ). Si el núcleo K es simétrico, según el teorema espectral , T _K tiene una base ortonormal de vectores propios. Los autovectores que corresponden a autovalores distintos de cero pueden ordenarse en una secuencia { e _i } _i (independientemente de la separabilidad).

Teorema . Si K es un núcleo simétrico definido positivo en ( X , M , μ), entonces

{\ Displaystyle K (y, x) = \ sum _ {i \ in \ mathbb {N}} \ lambda _ {i} e_ {i} (y) e_ {i} (x)}

donde la convergencia en la norma L ² . Tenga en cuenta que cuando no se asume la continuidad del núcleo, la expansión ya no converge de manera uniforme.

Condición de Mercer

En matemáticas , un verdadero -valued función K (x, y) se dice que cumplir la condición de Mercer si para todo cuadrado integrable funciones g ( x ) uno tiene

{\ Displaystyle \ iint g (x) K (x, y) g (y) \, dx \, dy \ geq 0.}

Analógico discreto

Esto es análogo a la definición de una matriz semidefinida positiva . Esta es una matriz ${\ Displaystyle K}$ de dimensión ${\ Displaystyle N}$ , que satisface, para todos los vectores ${\ Displaystyle g}$ , la propiedad

{\ Displaystyle (g, Kg) = g ^ {T} {\ cdot} Kg = \ sum _ {i = 1} ^ {N} \ sum _ {j = 1} ^ {N} \, g_ {i} \, K_ {ij} \, g_ {j} \ geq 0}

.

Ejemplos de

Una función constante positiva

{\ Displaystyle K (x, y) = c \,}

satisface la condición de Mercer, ya que entonces la integral se convierte en el teorema de Fubini

{\ Displaystyle \ iint g (x) \, c \, g (y) \, dxdy = c \ int \! g (x) \, dx \ int \! g (y) \, dy = c \ left ( \ int \! g (x) \, dx \ right) ^ {2}}

que de hecho no es negativo .

Ver también

Truco de kernel
Representante teorema
Teoría espectral
Condición de Mercer

Notas

^ http://www.cs.berkeley.edu/~bartlett/courses/281b-sp08/7.pdf

Referencias

Adriaan Zaanen, Análisis lineal , North Holland Publishing Co., 1960,
Ferreira, JC, Menegatto, VA, Autovalores de operadores integrales definidos por núcleos definidos positivos suaves , Ecuación integral y teoría del operador, 64 (2009), no. 1, 61–81. (Da la generalización del teorema de Mercer para espacios métricos. El resultado se adapta fácilmente a los primeros espacios topológicos contables)
Konrad Jörgens , Operadores integrales lineales , Pitman, Boston, 1982,
Richard Courant y David Hilbert , Methods of Mathematical Physics , vol 1, Interscience 1953,
Robert Ash, Teoría de la información , Publicaciones de Dover, 1990,
Mercer, J. (1909), "Funciones de tipo positivo y negativo y su conexión con la teoría de ecuaciones integrales", Transacciones filosóficas de la Royal Society A , 209 (441–458): 415–446, doi : 10.1098 / rsta .1909.0016,
"Teorema de Mercer" , Enciclopedia de Matemáticas , EMS Press , 2001 [1994]
H. König, Distribución de valores propios de operadores compactos , Birkhäuser Verlag, 1986. (Da la generalización del teorema de Mercer para medidas finitas μ.)

[1] ttp://www.cs.berkeley.edu/~bartlett/courses/281b-sp08/7.pdf

[1]