Complemento Schur

En álgebra lineal y teoría de matrices , el complemento de Schur de una matriz de bloques se define de la siguiente manera.

Suponga que p , q son números enteros no negativos, y suponga que A , B , C , D son respectivamente p × p , p × q , q × p y q × q matrices de números complejos. Dejar

{\ Displaystyle M = \ left [{\ begin {matrix} A&B \\ C&D \ end {matrix}} \ right]}

de modo que M es una matriz ( p + q ) × ( p + q ).

Si D es invertible, entonces el complemento de Schur del bloque D de la matriz M es la matriz p × p definida por

{\ Displaystyle M / D: = A-BD ^ {- 1} C.}

Si A es invertible, el complemento de Schur del bloque A de la matriz M es la matriz q × q definida por

{\ Displaystyle M / A: = D-CA ^ {- 1} B.}

En el caso de que A o D sea singular , al sustituir una inversa generalizada por las inversas en M / A y M / D se obtiene el complemento de Schur generalizado .

El complemento de Schur lleva el nombre de Issai Schur, quien lo usó para probar el lema de Schur , aunque ya se había usado anteriormente. ^[1] Emilie Virginia Haynsworth fue la primera en llamarlo el complemento Schur . ^[2] El complemento de Schur es una herramienta clave en los campos del análisis numérico, la estadística y el análisis matricial.

Fondo

El complemento de Schur surge como resultado de realizar una eliminación gaussiana en bloque al multiplicar la matriz M de la derecha por una matriz triangular inferior en bloque

{\ displaystyle L = {\ begin {bmatrix} I_ {p} & 0 \\ - D ^ {- 1} C & I_ {q} \ end {bmatrix}}.}

Aquí I _p denota una matriz identidad p × p . Después de la multiplicación con la matriz L, el complemento de Schur aparece en el bloque p × p superior . La matriz de productos es

{\ displaystyle {\ begin {align} ML & = {\ begin {bmatrix} A&B \\ C&D \ end {bmatrix}} {\ begin {bmatrix} I_ {p} & 0 \\ - D ^ {- 1} C & I_ {q } \ end {bmatrix}} = {\ begin {bmatrix} A-BD ^ {- 1} C&B \\ 0 & D \ end {bmatrix}} \\ [4pt] & = {\ begin {bmatrix} I_ {p} & BD ^ {- 1} \\ 0 & I_ {q} \ end {bmatrix}} {\ begin {bmatrix} A-BD ^ {- 1} C & 0 \\ 0 & D \ end {bmatrix}} \\ [6pt] \ Rightarrow M & = {\ begin {bmatrix} A&B \\ C&D \ end {bmatrix}} = {\ begin {bmatrix} I_ {p} & BD ^ {- 1} \\ 0 & I_ {q} \ end {bmatrix}} {\ begin {bmatrix } A-BD ^ {- 1} C & 0 \\ 0 & D \ end {bmatrix}} {\ begin {bmatrix} I_ {p} & 0 \\ D ^ {- 1} C & I_ {q} \ end {bmatrix}}, \ final {alineado}}}

Es decir, una descomposición de LDU . Por lo tanto, la inversa de M puede expresarse con D ⁻¹ y la inversa del complemento de Schur, si existe, como

{\ displaystyle {\ begin {alineado} M ^ {- 1} = {\ begin {bmatrix} A&B \\ C&D \ end {bmatrix}} ^ {- 1} = {} & \ left ({\ begin {bmatrix} I_ {p} & BD ^ {- 1} \\ 0 & I_ {q} \ end {bmatrix}} {\ begin {bmatrix} A-BD ^ {- 1} C & 0 \\ 0 & D \ end {bmatrix}} {\ begin { bmatrix} I_ {p} & 0 \\ D ^ {- 1} C & I_ {q} \ end {bmatrix}} \ right) ^ {- 1} \\ = {} & {\ begin {bmatrix} I_ {p} & 0 \\ - D ^ {- 1} C & I_ {q} \ end {bmatrix}} {\ begin {bmatrix} \ left (A-BD ^ {- 1} C \ right) ^ {- 1} & 0 \\ 0 & D ^ {-1} \ end {bmatrix}} {\ begin {bmatrix} I_ {p} & - BD ^ {- 1} \\ 0 & I_ {q} \ end {bmatrix}} \\ [4pt] = {} & { \ begin {bmatrix} \ left (A-BD ^ {- 1} C \ right) ^ {- 1} & - \ left (A-BD ^ {- 1} C \ right) ^ {- 1} BD ^ { -1} \\ - D ^ {- 1} C \ left (A-BD ^ {- 1} C \ right) ^ {- 1} & D ^ {- 1} + D ^ {- 1} C \ left ( A-BD ^ {- 1} C \ right) ^ {- 1} BD ^ {- 1} \ end {bmatrix}} \\ [4pt] = {} & {\ begin {bmatrix} \ left (M / D \ right) ^ {- 1} & - \ left (M / D \ right) ^ {- 1} BD ^ {- 1} \\ - D ^ {- 1} C \ left (M / D \ right) ^ {-1} & D ^ {- 1} + D ^ {- 1} C \ left (M / D \ right) ^ {- 1} BD ^ {- 1} \ end {bmatrix}}. \ End {alineado} }}

Cf. Lema de inversión de matriz que ilustra las relaciones entre lo anterior y la derivación equivalente con los roles de A y D intercambiados.

En otra interpretación, ^[3] el complemento de Schur también surge al resolver ecuaciones lineales, al eliminar un bloque de variables. Empezamos con

{\ displaystyle M = {\ begin {bmatrix} A&B \\ C&D \ end {bmatrix}} {\ begin {bmatrix} x \\ y \ end {bmatrix}} = {\ begin {bmatrix} u \\ v \ end {bmatrix}}}

.

Suponiendo que la submatriz ${\ Displaystyle A}$ es invertible, podemos eliminar ${\ Displaystyle x}$ de las ecuaciones, como sigue.

{\ Displaystyle x = A ^ {- 1} (u-By)}

.

Sustituyendo esta expresión en la segunda ecuación se obtiene

{\ Displaystyle \ left (D-CA ^ {- 1} B \ right) y = v-CA ^ {- 1} u}

.

Nos referimos a esto como la ecuación reducida obtenida al eliminar ${\ Displaystyle x}$ de la ecuación original. La matriz que aparece en la ecuación reducida se llama complemento de Schur del primer bloque ${\ Displaystyle A}$ en ${\ Displaystyle M}$ :

{\ Displaystyle S \ {\ overset {\ underset {\ mathrm {def}} {}} {=}} \ D-CA ^ {- 1} B}

.

Resolviendo la ecuación reducida, obtenemos

{\ Displaystyle y = S ^ {- 1} \ left (v-CA ^ {- 1} u \ right)}

.

Sustituyendo esto en la primera ecuación se obtiene

{\ Displaystyle x = \ left (A ^ {- 1} + A ^ {- 1} BS ^ {- 1} CA ^ {- 1} \ right) uA ^ {- 1} BS ^ {- 1} v}

.

Podemos expresar las dos ecuaciones anteriores como:

{\ displaystyle {\ begin {bmatrix} x \\ y \ end {bmatrix}} = {\ begin {bmatrix} A ^ {- 1} + A ^ {- 1} BS ^ {- 1} CA ^ {- 1 } & - A ^ {- 1} BS ^ {- 1} \\ - S ^ {- 1} CA ^ {- 1} & S ^ {- 1} \ end {bmatrix}} {\ begin {bmatrix} u \ \ v \ end {bmatrix}}}

.

Por lo tanto, una formulación para la inversa de una matriz de bloques es:

{\ displaystyle {\ begin {bmatrix} A&B \\ C&D \ end {bmatrix}} ^ {- 1} = {\ begin {bmatrix} A ^ {- 1} + A ^ {- 1} BS ^ {- 1} CA ^ {- 1} & - A ^ {- 1} BS ^ {- 1} \\ - S ^ {- 1} CA ^ {- 1} & S ^ {- 1} \ end {bmatrix}}}

.

En particular, vemos que el complemento de Schur es el inverso del ${\ Displaystyle 2,2}$ bloquear la entrada de la inversa de ${\ Displaystyle M}$ .

Propiedades

Si p y q son ambos 1 (es decir, A , B , C y D son todos los escalares), obtenemos la fórmula familiar para la inversa de una matriz de 2 por 2:
${\ Displaystyle M ^ {- 1} = {\ frac {1} {AD-BC}} \ left [{\ begin {matrix} D & -B \\ - C&A \ end {matrix}} \ right]}$
siempre que AD - BC sea distinto de cero.
En general, si A es invertible, entonces
${\ displaystyle {\ begin {align} M & = {\ begin {bmatrix} I_ {p} & 0 \\ CA ^ {- 1} & I_ {q} \ end {bmatrix}} {\ begin {bmatrix} A & 0 \\ 0 & D -CA ^ {- 1} B \ end {bmatrix}} {\ begin {bmatrix} I_ {p} & A ^ {- 1} B \\ 0 & I_ {q} \ end {bmatrix}}, \\ [4pt] M ^ {- 1} & = {\ begin {bmatrix} A ^ {- 1} + A ^ {- 1} B (M / A) ^ {- 1} CA ^ {- 1} & - A ^ {- 1 } B (M / A) ^ {- 1} \\ - (M / A) ^ {- 1} CA ^ {- 1} & (M / A) ^ {- 1} \ end {bmatrix}} \ end {alineado}}}$
siempre que exista este inverso.
Cuando A , respectivamente D , es invertible, también se ve claramente que el determinante de M viene dado por
${\ Displaystyle \ det (M) = \ det (A) \ det \ left (D-CA ^ {- 1} B \ right)}$ , respectivamente
${\ Displaystyle \ det (M) = \ det (D) \ det \ left (A-BD ^ {- 1} C \ right)}$ ,
que generaliza la fórmula determinante para matrices 2 × 2.
(Fórmula de aditividad de rango de Guttman) Si D es invertible, entonces el rango de M viene dado por
${\ Displaystyle \ operatorname {rango} (M) = \ operatorname {rango} (D) + \ operatorname {rango} \ left (A-BD ^ {- 1} C \ right)}$
( Haynsworth fórmula inercia aditividad ) Si A es invertible, entonces la inercia de la matriz de bloque M es igual a la inercia de A más la inercia de M / A .

Aplicación a la resolución de ecuaciones lineales.

El complemento de Schur surge naturalmente al resolver un sistema de ecuaciones lineales como

{\ displaystyle {\ begin {alineado} Ax + By & = a \\ Cx + Dy & = b \ end {alineado}}}

donde x , a son vectores de columna p -dimensionales , y , b son vectores de columna q -dimensionales, A , B , C , D son como arriba y D es invertible. Multiplicando la ecuación inferior por ${\ textstyle BD ^ {- 1}}$ y luego restando de la ecuación superior se obtiene

{\ Displaystyle \ left (A-BD ^ {- 1} C \ right) x = a-BD ^ {- 1} b.}

Por lo tanto, si se puede invertir D así como el complemento de Schur de D , se puede resolver para x , y luego usando la ecuación ${\ textstyle Cx + Dy = b}$ uno puede resolver para y . Esto reduce el problema de invertir un ${\ textstyle (p + q) \ times (p + q)}$ matriz a la de invertir una matriz p × p y una matriz q × q . En la práctica, se necesita que D esté bien acondicionado para que este algoritmo sea numéricamente preciso.

En ingeniería eléctrica, esto a menudo se denomina eliminación de nodos o reducción de Kron .

Aplicaciones a la teoría de la probabilidad y la estadística

Suponga que los vectores de columna aleatorios X , Y viven en R ⁿ y R ^m respectivamente, y que el vector ( X , Y ) en R ^{n + m} tiene una distribución normal multivariante cuya covarianza es la matriz simétrica definida positiva

{\ Displaystyle \ Sigma = \ left [{\ begin {matrix} A&B \\ B ^ {\ mathsf {T}} & C \ end {matrix}} \ right],}

dónde ${\ textstyle A \ in \ mathbb {R} ^ {n \ times n}}$ es la matriz de covarianza de X , ${\ textstyle C \ in \ mathbb {R} ^ {m \ times m}}$ es la matriz de covarianza de Y y ${\ textstyle B \ in \ mathbb {R} ^ {n \ times m}}$ es la matriz de covarianza entre X y Y .

Entonces la covarianza condicional de X dada Y es el complemento de Schur de C en ${\ textstyle \ Sigma}$ : ^[4]

{\ Displaystyle {\ begin {alineado} \ operatorname {Cov} (X \ mid Y) & = A-BC ^ {- 1} B ^ {\ mathsf {T}} \\\ operatorname {E} (X \ mid Y) & = \ nombre de operador {E} (X) + BC ^ {- 1} (Y- \ nombre de operador {E} (Y)) \ end {alineado}}}

Si tomamos la matriz ${\ Displaystyle \ Sigma}$ anterior, no una covarianza de un vector aleatorio, sino una covarianza de muestra , entonces puede tener una distribución de Wishart . En ese caso, el complemento de Schur de C en ${\ Displaystyle \ Sigma}$ también tiene una distribución Wishart. ^{[ cita requerida ]}

Condiciones para la definición positiva y la semidefinición

Sea X una matriz simétrica de números reales dada por

{\ Displaystyle X = \ left [{\ begin {matrix} A&B \\ B ^ {\ mathsf {T}} & C \ end {matrix}} \ right].}

Luego

Si A es invertible, entonces X es positivo definido si y solo si A y su complemento X / A son ambos positivos definidos:
${\ Displaystyle X \ succ 0 \ Leftrightarrow A \ succ 0, X / A = CB ^ {\ mathsf {T}} A ^ {- 1} B \ succ 0.}$ ^[5]
Si C es invertible, entonces X es positivo definido si y solo si C y su complemento X / C son ambos positivos definidos:
${\ Displaystyle X \ succ 0 \ Leftrightarrow C \ succ 0, X / C = A-BC ^ {- 1} B ^ {\ mathsf {T}} \ succ 0.}$
Si A es positivo definido, entonces X es positivo semi-definido si y solo si el complemento X / A es positivo semi-definido:
${\ displaystyle {\ text {If}} A \ succ 0, {\ text {then}} X \ successq 0 \ Leftrightarrow X / A = CB ^ {\ mathsf {T}} A ^ {- 1} B \ successq 0.}$ ^[5]
Si C es positivo definido, entonces X es positivo semi-definido si y solo si el complemento X / C es positivo semi-definido:
${\ displaystyle {\ text {If}} C \ succ 0, {\ text {then}} X \ successq 0 \ Leftrightarrow X / C = A-BC ^ {- 1} B ^ {\ mathsf {T}} \ Successq 0.}$

Las declaraciones primera y tercera pueden derivarse ^[3] considerando el minimizador de la cantidad

{\ Displaystyle u ^ {\ mathsf {T}} Au + 2v ^ {\ mathsf {T}} B ^ {\ mathsf {T}} u + v ^ {\ mathsf {T}} Cv, \,}

en función de v (para u fija ).

Además, dado que

{\ Displaystyle \ left [{\ begin {matrix} A&B \\ B ^ {\ mathsf {T}} & C \ end {matrix}} \ right] \ succ 0 \ Longleftrightarrow \ left [{\ begin {matrix} C y B ^ {\ mathsf {T}} \\ B&A \ end {matrix}} \ right] \ succ 0}

y de manera similar para matrices semidefinidas positivas, la segunda (respectivamente cuarta) declaración es inmediata a la primera (o tercera) declaración.

También hay una condición suficiente y necesaria para la semidefinición positiva de X en términos de un complemento de Schur generalizado. ^[1] Precisamente,

${\ displaystyle X \ successq 0 \ Leftrightarrow A \ successq 0, CB ^ {\ mathsf {T}} A ^ {g} B \ successq 0, \ left (I-AA ^ {g} \ right) B = 0 \ ,}$ y
${\ Displaystyle X \ Successq 0 \ Leftrightarrow C \ Successq 0, A-BC ^ {g} B ^ {\ mathsf {T}} \ Successq 0, \ left (I-CC ^ {g} \ right) B ^ { \ mathsf {T}} = 0,}$

dónde ${\ Displaystyle A ^ {g}}$ denota el inverso generalizado de ${\ Displaystyle A}$ .

Ver también

Referencias

↑ ^a ^b Zhang, Fuzhen (2005). Zhang, Fuzhen (ed.). El complemento Schur y sus aplicaciones . Métodos numéricos y algoritmos. 4 . Saltador. doi : 10.1007 / b105056 . ISBN 0-387-24271-6.
^ Haynsworth, EV, "Sobre el complemento Schur", Notas matemáticas de Basilea , #BNB 20, 17 páginas, junio de 1968.
^ ^a ^b Boyd, S. y Vandenberghe, L. (2004), "Optimización convexa", Cambridge University Press (Apéndice A.5.5)
^ von Mises, Richard (1964). "Capítulo VIII.9.3". Teoría matemática de probabilidad y estadística . Prensa académica. ISBN 978-1483255385.
^ ^a ^b Zhang, Fuzhen (2005). El complemento Schur y sus aplicaciones . Saltador. pag. 34.

[Zh:05-1] Zhang, Fuzhen (2005). Zhang, Fuzhen (ed.). El complemento Schur y sus aplicaciones . Métodos numéricos y algoritmos. 4 . Saltador. doi : 10.1007 / b105056 . ISBN 0-387-24271-6.

[2] Haynsworth, EV, "Sobre el complemento Schur", Notas matemáticas de Basilea , #BNB 20, 17 páginas, junio de 1968.

[:0-3] Boyd, S. y Vandenberghe, L. (2004), "Optimización convexa", Cambridge University Press (Apéndice A.5.5)

[vMi:64-4] von Mises, Richard (1964). "Capítulo VIII.9.3". Teoría matemática de probabilidad y estadística . Prensa académica. ISBN 978-1483255385.

[Springer-5] Zhang, Fuzhen (2005). El complemento Schur y sus aplicaciones . Saltador. pag. 34.

[1]