Suponga que p , q son números enteros no negativos, y suponga que A , B , C , D son respectivamente p × p , p × q , q × p y q × q matrices de números complejos. Dejar
de modo que M es una matriz ( p + q ) × ( p + q ).
Si D es invertible, entonces el complemento de Schur del bloque D de la matriz M es la matriz p × p definida por
Si A es invertible, el complemento de Schur del bloque A de la matriz M es la matriz q × q definida por
En el caso de que A o D sea singular , al sustituir una inversa generalizada por las inversas en M / A y M / D se obtiene el complemento de Schur generalizado .
El complemento de Schur lleva el nombre de Issai Schur, quien lo usó para probar el lema de Schur , aunque ya se había usado anteriormente. [1] Emilie Virginia Haynsworth fue la primera en llamarlo el complemento Schur . [2] El complemento de Schur es una herramienta clave en los campos del análisis numérico, la estadística y el análisis matricial.
Fondo
El complemento de Schur surge como resultado de realizar una eliminación gaussiana en bloque al multiplicar la matriz M de la derecha por una matriz triangular inferior en bloque
Aquí I p denota una matriz identidad p × p . Después de la multiplicación con la matriz L, el complemento de Schur aparece en el bloque p × p superior . La matriz de productos es
Es decir, una descomposición de LDU . Por lo tanto, la inversa de M puede expresarse con D −1 y la inversa del complemento de Schur, si existe, como
Cf. Lema de inversión de matriz que ilustra las relaciones entre lo anterior y la derivación equivalente con los roles de A y D intercambiados.
En otra interpretación, [3] el complemento de Schur también surge al resolver ecuaciones lineales, al eliminar un bloque de variables. Empezamos con
.
Suponiendo que la submatriz es invertible, podemos eliminar de las ecuaciones, como sigue.
.
Sustituyendo esta expresión en la segunda ecuación se obtiene
.
Nos referimos a esto como la ecuación reducida obtenida al eliminarde la ecuación original. La matriz que aparece en la ecuación reducida se llama complemento de Schur del primer bloque en :
.
Resolviendo la ecuación reducida, obtenemos
.
Sustituyendo esto en la primera ecuación se obtiene
.
Podemos expresar las dos ecuaciones anteriores como:
.
Por lo tanto, una formulación para la inversa de una matriz de bloques es:
.
En particular, vemos que el complemento de Schur es el inverso del bloquear la entrada de la inversa de .
Propiedades
Si p y q son ambos 1 (es decir, A , B , C y D son todos los escalares), obtenemos la fórmula familiar para la inversa de una matriz de 2 por 2:
Cuando A , respectivamente D , es invertible, también se ve claramente que el determinante de M viene dado por
, respectivamente
,
que generaliza la fórmula determinante para matrices 2 × 2.
(Fórmula de aditividad de rango de Guttman) Si D es invertible, entonces el rango de M viene dado por
( Haynsworth fórmula inercia aditividad ) Si A es invertible, entonces la inercia de la matriz de bloque M es igual a la inercia de A más la inercia de M / A .
Aplicación a la resolución de ecuaciones lineales.
El complemento de Schur surge naturalmente al resolver un sistema de ecuaciones lineales como
donde x , a son vectores de columna p -dimensionales , y , b son vectores de columna q -dimensionales, A , B , C , D son como arriba y D es invertible. Multiplicando la ecuación inferior por y luego restando de la ecuación superior se obtiene
Por lo tanto, si se puede invertir D así como el complemento de Schur de D , se puede resolver para x , y luego usando la ecuaciónuno puede resolver para y . Esto reduce el problema de invertir unmatriz a la de invertir una matriz p × p y una matriz q × q . En la práctica, se necesita que D esté bien acondicionado para que este algoritmo sea numéricamente preciso.
En ingeniería eléctrica, esto a menudo se denomina eliminación de nodos o reducción de Kron .
Aplicaciones a la teoría de la probabilidad y la estadística
Suponga que los vectores de columna aleatorios X , Y viven en R n y R m respectivamente, y que el vector ( X , Y ) en R n + m tiene una distribución normal multivariante cuya covarianza es la matriz simétrica definida positiva
dónde es la matriz de covarianza de X ,es la matriz de covarianza de Y yes la matriz de covarianza entre X y Y .
Si tomamos la matriz anterior, no una covarianza de un vector aleatorio, sino una covarianza de muestra , entonces puede tener una distribución de Wishart . En ese caso, el complemento de Schur de C entambién tiene una distribución Wishart. [ cita requerida ]
Condiciones para la definición positiva y la semidefinición
Sea X una matriz simétrica de números reales dada por
Luego
Si A es invertible, entonces X es positivo definido si y solo si A y su complemento X / A son ambos positivos definidos:
Si C es positivo definido, entonces X es positivo semi-definido si y solo si el complemento X / C es positivo semi-definido:
Las declaraciones primera y tercera pueden derivarse [3] considerando el minimizador de la cantidad
en función de v (para u fija ).
Además, dado que
y de manera similar para matrices semidefinidas positivas, la segunda (respectivamente cuarta) declaración es inmediata a la primera (o tercera) declaración.
También hay una condición suficiente y necesaria para la semidefinición positiva de X en términos de un complemento de Schur generalizado. [1] Precisamente,
↑ a b Zhang, Fuzhen (2005). Zhang, Fuzhen (ed.). El complemento Schur y sus aplicaciones . Métodos numéricos y algoritmos. 4 . Saltador. doi : 10.1007 / b105056 . ISBN 0-387-24271-6.
^ Haynsworth, EV, "Sobre el complemento Schur", Notas matemáticas de Basilea , #BNB 20, 17 páginas, junio de 1968.
^ a b Boyd, S. y Vandenberghe, L. (2004), "Optimización convexa", Cambridge University Press (Apéndice A.5.5)