En matemáticas , el cociente de Rayleigh [1] ( ) para un complejo dado matriz hermitiana M y distinto de cero vector x se define como: [2] [3]
Para matrices y vectores reales, la condición de ser hermitiano se reduce a la de ser simétrico , y la transposición conjugada a la transposición habitual . Tenga en cuenta quepara cualquier escalar distinto de cero c . Recuerde que una matriz hermitiana (o simétrica real) es diagonalizable solo con valores propios reales . Se puede demostrar que, para una matriz dada, el cociente de Rayleigh alcanza su valor mínimo(el valor propio más pequeño de M ) cuando x es(el vector propio correspondiente ). [4] Del mismo modo, y .
El cociente de Rayleigh se utiliza en el teorema mínimo-máximo para obtener valores exactos de todos los valores propios. También se utiliza en algoritmos de valor propio (como la iteración del cociente de Rayleigh ) para obtener una aproximación de valor propio a partir de una aproximación de vector propio.
El rango del cociente de Rayleigh (para cualquier matriz, no necesariamente hermitiana) se llama rango numérico y contiene su espectro . Cuando la matriz es hermitiana, el rango numérico es igual a la norma espectral. Todavía en análisis funcional,se conoce como radio espectral . En el contexto de C * -álgebras o mecánica cuántica algebraica, la función que a M asocia el cociente de Rayleigh-Ritz R ( M , x ) para una x fija y M que varía a través del álgebra se denominaría "estado vectorial" de el álgebra.
En mecánica cuántica , el cociente de Rayleigh da el valor esperado del observable correspondiente al operador M para un sistema cuyo estado está dado por x .
Si fijamos la matriz compleja M , entonces el mapa del cociente de Rayleigh resultante (considerado como una función de x ) determina completamente M a través de la identidad de polarización ; de hecho, esto sigue siendo cierto incluso si permitimos que M no sea hermitiano. (Sin embargo, si restringimos el campo de escalares a los números reales, entonces el cociente de Rayleigh solo determina la parte simétrica de M ).
Como se indicó en la introducción, para cualquier vector x , uno tiene, dónde son, respectivamente, los valores propios más pequeños y más grandes de . Esto es inmediato después de observar que el cociente de Rayleigh es un promedio ponderado de los valores propios de M :
dónde es el el par propio después de la ortonormalización y es el la coordenada de x en la base propia. Entonces es fácil verificar que los límites se alcanzan en los vectores propios correspondientes.
El hecho de que el cociente sea un promedio ponderado de los valores propios se puede utilizar para identificar el segundo, el tercero, ... los valores propios más grandes. Dejarsean los valores propios en orden decreciente. Si y está restringido a ser ortogonal a , en ese caso , luego tiene valor máximo , que se logra cuando .
Una matriz de covarianza empírica se puede representar como el producto de la matriz de datos multiplicado previamente por su transposición . Al ser una matriz semidefinida positiva, tiene valores propios no negativos y vectores propios ortogonales (u ortogonalizables), que se pueden demostrar de la siguiente manera.
En primer lugar, que los valores propios no son negativos:
En segundo lugar, que los vectores propios son ortogonales entre sí:
si los valores propios son diferentes, en el caso de multiplicidad, la base se puede ortogonalizar.
Para establecer ahora que el cociente de Rayleigh es maximizado por el autovector con el autovalor más grande, considere descomponer un vector arbitrario sobre la base de los vectores propios :
dónde
es la coordenada de proyectado ortogonalmente sobre . Por tanto, tenemos:
que, por ortonormalidad de los autovectores, se convierte en:
La última representación establece que el cociente de Rayleigh es la suma de los cosenos al cuadrado de los ángulos formados por el vector y cada vector propio , ponderado por los valores propios correspondientes.
Si un vector maximiza , entonces cualquier múltiplo escalar distinto de cero también maximiza , por lo que el problema se puede reducir al problema de Lagrange de maximizar bajo la restricción de que .
Definir: . Este se convierte entonces en un programa lineal , que siempre alcanza su máximo en una de las esquinas del dominio. Un punto máximo tendrá y para todos (cuando los valores propios se ordenan por magnitud decreciente).
Por tanto, el cociente de Rayleigh se maximiza mediante el vector propio con el valor propio más grande.
Formulación usando multiplicadores de Lagrange
Alternativamente, se puede llegar a este resultado mediante el método de los multiplicadores de Lagrange . La primera parte es para mostrar que el cociente es constante bajo escala, dónde es un escalar
Debido a esta invariancia, es suficiente estudiar el caso especial . El problema es entonces encontrar los puntos críticos de la función
- ,
sujeto a la restricción En otras palabras, es encontrar los puntos críticos de
dónde es un multiplicador de Lagrange. Los puntos estacionarios de ocurrir en
y
Por lo tanto, los vectores propios de son los puntos críticos del cociente de Rayleigh y sus valores propios correspondientes son los valores estacionarios de . Esta propiedad es la base para el análisis de componentes principales y la correlación canónica .
La teoría de Sturm-Liouville se refiere a la acción del operador lineal
en el espacio interior del producto definido por
de las funciones que satisface algunas especificados condiciones de contorno en una y b . En este caso, el cociente de Rayleigh es
Esto a veces se presenta en una forma equivalente, obtenida separando la integral en el numerador y usando la integración por partes :