Matriz definida

En matemáticas , una matriz simétrica ${\ Displaystyle M}$ con entradas reales es positivo-definido si el número real ${\ Displaystyle z ^ {\ textsf {T}} Mz}$ es positivo para cada vector de columna real distinto de cero ${\ Displaystyle z,}$ dónde ${\ Displaystyle z ^ {\ textsf {T}}}$ es la transposición de ${\ Displaystyle z}$ . ^[1] De manera más general, una matriz hermitiana (es decir, una matriz compleja igual a su transpuesta conjugada ) es positiva-definida si el número real ${\ Displaystyle z ^ {*} Mz}$ es positivo para cada vector de columna complejo distinto de cero ${\ Displaystyle z,}$ dónde ${\ Displaystyle z ^ {*}}$ denota la transposición conjugada de ${\ Displaystyle z.}$

Las matrices semidefinidas positivas se definen de manera similar, excepto que los escalares ${\ Displaystyle z ^ {\ textsf {T}} Mz}$ y ${\ Displaystyle z ^ {*} Mz}$ deben ser positivos o cero (es decir, no negativos). Las matrices negativas-definidas y negativas semi-definidas se definen de forma análoga. Una matriz que no es semidefinida positiva ni semidefinida negativa a veces se denomina indefinida .

Por tanto, una matriz es positiva-definida si y sólo si es la matriz de una forma cuadrática positiva-definida o forma hermitiana . En otras palabras, una matriz es positiva-definida si y solo si define un producto interno .

Las matrices positivas-definidas y positivas-semidefinidas se pueden caracterizar de muchas formas, lo que puede explicar la importancia del concepto en varias partes de las matemáticas. Una matriz $M$ es positiva-definida (resp. Positiva-semidefinida) si y solo si satisface alguna de las siguientes condiciones equivalentes.

$M$ es congruente con una matriz diagonal con entradas reales positivas (o no negativas).
$M$ es simétrico o hermitiano, y todos sus valores propios son reales y positivos (o no negativos).
$M$ es simétrica o hermitiana, y todos sus principales menores principales son positivos (resp. Todos los menores principales son no negativos).
Existe una matriz invertible (resp. Una matriz) ${\ Displaystyle B}$ con transposición conjugada ${\ Displaystyle B ^ {*}}$ tal que ${\ Displaystyle M = B ^ {*} B.}$

Las matrices reales positivas-definidas y positivas-semidefinidas están en la base de la optimización convexa , ya que, dada una función de varias variables reales que es dos veces diferenciable , entonces si su matriz hessiana (matriz de sus segundas derivadas parciales) es positiva-definida en un punto $p$ , entonces la función es convexa cerca de $p$ y, a la inversa, si la función es convexa cerca de $p$ , entonces la matriz de Hesse es positiva-semidefinida en $p$ .

Algunos autores utilizan definiciones más generales de definición, incluidas algunas matrices reales no simétricas o complejas no hermitianas.

Definiciones

En las siguientes definiciones, ${\ Displaystyle \ mathbf {x} ^ {\ textsf {T}}}$ es la transposición de ${\ Displaystyle \ mathbf {x}}$ , ${\ Displaystyle \ mathbf {x} ^ {*}}$ es la transposición conjugada de ${\ Displaystyle \ mathbf {x}}$ y ${\ Displaystyle \ mathbf {0}}$ denota el vector cero n- dimensional.

Definiciones para matrices reales

Un ${\ Displaystyle n \ times n}$ matriz real simétrica ${\ Displaystyle M}$ se dice que es positivo-definido si ${\ Displaystyle \ mathbf {x} ^ {\ textsf {T}} M \ mathbf {x}> 0}$ para todos los distintos de cero ${\ Displaystyle \ mathbf {x}}$ en ${\ Displaystyle \ mathbb {R} ^ {n}}$ . Formalmente,

${\ Displaystyle M {\ text {positivo-definido}} \ quad \ iff \ quad \ mathbf {x} ^ {\ textsf {T}} M \ mathbf {x}> 0 {\ text {para todos}} \ mathbf {x} \ in \ mathbb {R} ^ {n} \ setminus \ {\ mathbf {0} \}}$

Un ${\ Displaystyle n \ times n}$ matriz real simétrica ${\ Displaystyle M}$ se dice que es positivo semidefinido o no negativo-definido si ${\ Displaystyle \ mathbf {x} ^ {\ textsf {T}} M \ mathbf {x} \ geq 0}$ para todos ${\ Displaystyle \ mathbf {x}}$ en ${\ Displaystyle \ mathbb {R} ^ {n}}$ . Formalmente,

${\ displaystyle M {\ text {semidefinido positivo}} \ quad \ iff \ quad \ mathbf {x} ^ {\ textsf {T}} M \ mathbf {x} \ geq 0 {\ text {para todos}} \ mathbf {x} \ in \ mathbb {R} ^ {n}}$

Un ${\ Displaystyle n \ times n}$ matriz real simétrica ${\ Displaystyle M}$ se dice que es negativo-definido si ${\ Displaystyle \ mathbf {x} ^ {\ textsf {T}} M \ mathbf {x} <0}$ para todos los distintos de cero ${\ Displaystyle \ mathbf {x}}$ en ${\ Displaystyle \ mathbb {R} ^ {n}}$ . Formalmente,

${\ Displaystyle M {\ text {negativo-definido}} \ quad \ iff \ quad \ mathbf {x} ^ {\ textsf {T}} M \ mathbf {x} <0 {\ text {para todos}} \ mathbf {x} \ in \ mathbb {R} ^ {n} \ setminus \ {\ mathbf {0} \}}$

Un ${\ Displaystyle n \ times n}$ matriz real simétrica ${\ Displaystyle M}$ se dice que es negativo-semidefinido o no positivo-definido si ${\ displaystyle x ^ {\ textsf {T}} Mx \ leq 0}$ para todos ${\ Displaystyle x}$ en ${\ Displaystyle \ mathbb {R} ^ {n}}$ . Formalmente,

${\ displaystyle M {\ text {semidefinido negativo}} \ quad \ iff \ quad \ mathbf {x} ^ {\ textsf {T}} M \ mathbf {x} \ leq 0 {\ text {para todos}} \ mathbf {x} \ in \ mathbb {R} ^ {n}}$

Un ${\ Displaystyle n \ times n}$ La matriz real simétrica que no es ni semidefinida positiva ni semidefinita negativa se llama indefinida .

Definiciones para matrices complejas

Todas las siguientes definiciones involucran el término ${\ Displaystyle \ mathbf {x} ^ {*} M \ mathbf {x}}$ . Tenga en cuenta que este es siempre un número real para cualquier matriz cuadrada hermitiana. ${\ Displaystyle M}$ .

Un ${\ Displaystyle n \ times n}$ Matriz compleja hermitiana ${\ Displaystyle M}$ se dice que es positivo-definido si ${\ Displaystyle \ mathbf {x} ^ {*} M \ mathbf {x}> 0}$ para todos los distintos de cero ${\ Displaystyle \ mathbf {x}}$ en ${\ Displaystyle \ mathbb {C} ^ {n}}$ . Formalmente,

${\ Displaystyle M {\ text {positivo-definido}} \ quad \ iff \ quad \ mathbf {x} ^ {*} M \ mathbf {x}> 0 {\ text {para todos}} \ mathbf {x} \ en \ mathbb {C} ^ {n} \ setminus \ {\ mathbf {0} \}}$

Un ${\ Displaystyle n \ times n}$ Matriz compleja hermitiana ${\ Displaystyle M}$ se dice que es positivo semi-definido o no negativo-definido si ${\ displaystyle x ^ {*} Mx \ geq 0}$ para todos ${\ Displaystyle x}$ en ${\ Displaystyle \ mathbb {C} ^ {n}}$ . Formalmente,

${\ displaystyle M {\ text {semidefinido positivo}} \ quad \ iff \ quad \ mathbf {x} ^ {*} M \ mathbf {x} \ geq 0 {\ text {para todos}} \ mathbf {x } \ in \ mathbb {C} ^ {n}}$

Un ${\ Displaystyle n \ times n}$ Matriz compleja hermitiana ${\ Displaystyle M}$ se dice que es negativo-definido si ${\ Displaystyle \ mathbf {x} ^ {*} M \ mathbf {x} <0}$ para todos los distintos de cero ${\ Displaystyle \ mathbf {x}}$ en ${\ Displaystyle \ mathbb {C} ^ {n}}$ . Formalmente,

${\ Displaystyle M {\ text {negativo-definido}} \ quad \ iff \ quad \ mathbf {x} ^ {*} M \ mathbf {x} <0 {\ text {para todos}} \ mathbf {x} \ en \ mathbb {C} ^ {n} \ setminus \ {\ mathbf {0} \}}$

Un ${\ Displaystyle n \ times n}$ Matriz compleja hermitiana ${\ Displaystyle M}$ se dice que es negativo semi-definido o no positivo-definido si ${\ Displaystyle \ mathbf {x} ^ {*} M \ mathbf {x} \ leq 0}$ para todos ${\ Displaystyle \ mathbf {x}}$ en ${\ Displaystyle \ mathbb {C} ^ {n}}$ . Formalmente,

${\ Displaystyle M {\ text {semidefinido negativo}} \ quad \ iff \ quad \ mathbf {x} ^ {*} M \ mathbf {x} \ leq 0 {\ text {para todos}} \ mathbf {x } \ in \ mathbb {C} ^ {n}}$

Un ${\ Displaystyle n \ times n}$ La matriz compleja hermitiana que no es ni semidefinita positiva ni semidefinita negativa se llama indefinida .

Coherencia entre definiciones reales y complejas

Dado que toda matriz real es también una matriz compleja, las definiciones de "definición" para las dos clases deben coincidir.

Para matrices complejas, la definición más común dice que " ${\ Displaystyle M}$ es positivo-definido si y solo si ${\ Displaystyle \ mathbf {z} ^ {*} M \ mathbf {z}}$ es real y positivo para todos los vectores de columna complejos distintos de cero ${\ Displaystyle \ mathbf {z}}$ ". Esta condición implica que ${\ Displaystyle M}$ es hermitiano (es decir, su transposición es igual a su conjugado). Para ver esto, considere las matrices ${\ textstyle A = {\ frac {1} {2}} \ left (M + M ^ {*} \ right)}$ y ${\ textstyle B = {\ frac {1} {2i}} \ left (MM ^ {*} \ right)}$ , así que eso ${\ Displaystyle M = A + iB}$ y ${\ Displaystyle \ mathbf {z} ^ {*} M \ mathbf {z} = \ mathbf {z} ^ {*} A \ mathbf {z} + i \ mathbf {z} ^ {*} B \ mathbf {z }}$ . Las matrices ${\ Displaystyle A}$ y ${\ Displaystyle B}$ son hermitianos, por lo tanto ${\ Displaystyle \ mathbf {z} ^ {*} A \ mathbf {z}}$ y ${\ Displaystyle \ mathbf {z} ^ {*} B \ mathbf {z}}$ son individualmente reales. Si ${\ Displaystyle \ mathbf {z} ^ {*} M \ mathbf {z}}$ es real, entonces ${\ Displaystyle \ mathbf {z} ^ {*} B \ mathbf {z}}$ debe ser cero para todos ${\ Displaystyle \ mathbf {z}}$ . Luego ${\ Displaystyle B}$ es la matriz cero y ${\ Displaystyle M = A}$ , demostrando que ${\ Displaystyle M}$ es hermitiano.

Según esta definición, una matriz real definida positiva ${\ Displaystyle M}$ es hermitiano, por lo tanto simétrico; y ${\ Displaystyle \ mathbf {z} ^ {\ textsf {T}} M \ mathbf {z}}$ es positivo para todos los vectores de columna reales distintos de cero ${\ Displaystyle \ mathbf {z}}$ . Sin embargo, la última condición por sí sola no es suficiente para ${\ Displaystyle M}$ ser positivo-definido. Por ejemplo, si

{\ displaystyle M = {\ begin {bmatrix} 1 & 1 \\ - 1 & 1 \ end {bmatrix}},}

luego para cualquier vector real ${\ Displaystyle \ mathbf {z}}$ con entradas ${\ Displaystyle a}$ y ${\ Displaystyle b}$ tenemos ${\ Displaystyle \ mathbf {z} ^ {\ textsf {T}} M \ mathbf {z} = \ left (a + b \ right) a + \ left (-a + b \ right) b = a ^ {2} + b ^ {2}}$ , que siempre es positivo si ${\ Displaystyle \ mathbf {z}}$ no es cero. Sin embargo, si ${\ Displaystyle \ mathbf {z}}$ es el vector complejo con entradas ${\ Displaystyle 1}$ y ${\ Displaystyle i}$ , uno obtiene

{\ Displaystyle \ mathbf {z} ^ {*} M \ mathbf {z} = {\ begin {bmatrix} 1 & -i \ end {bmatrix}} M {\ begin {bmatrix} 1 \\ i \ end {bmatrix} } = {\ begin {bmatrix} 1 + i & 1-i \ end {bmatrix}} {\ begin {bmatrix} 1 \\ i \ end {bmatrix}} = 2 + 2i}

que no es real. Por lo tanto, ${\ Displaystyle M}$ no es positivo-definido.

Por otro lado, para una matriz real simétrica ${\ Displaystyle M}$ , la condición " ${\ Displaystyle \ mathbf {z} ^ {\ textsf {T}} M \ mathbf {z}> 0}$ para todos los vectores reales distintos de cero ${\ Displaystyle \ mathbf {z}}$ " No implica que ${\ Displaystyle M}$ es positivo-definido en el sentido complejo.

Notación

Si una matriz hermitiana ${\ Displaystyle M}$ es positivo semi-definido, a veces se escribe ${\ Displaystyle M \ Successq 0}$ y si ${\ Displaystyle M}$ es positivo-definido uno escribe ${\ Displaystyle M \ succ 0}$ . Para denotar que ${\ Displaystyle M}$ es semi-definido negativo uno escribe ${\ Displaystyle M \ preceq 0}$ y para denotar que ${\ Displaystyle M}$ es negativo-definido uno escribe ${\ Displaystyle M \ prec 0}$ .

La noción proviene del análisis funcional donde las matrices semidefinidas positivas definen operadores positivos .

Una notación alternativa común es ${\ Displaystyle M \ geq 0}$ , ${\ Displaystyle M> 0}$ , ${\ Displaystyle M \ leq 0}$ y ${\ Displaystyle M <0}$ para matrices positivas semi-definidas y positivas-definidas, negativas semi-definidas y negativas-definidas, respectivamente. Esto puede resultar confuso, ya que a veces las matrices no negativas (respectivamente, las matrices no positivas) también se indican de esta forma.

Ejemplos de

La matriz de identidad ${\ displaystyle I = {\ begin {bmatrix} 1 & 0 \\ 0 & 1 \ end {bmatrix}}}$ es positivo-definido (y como tal también positivo semi-definido). Es una matriz simétrica real, y, por cualquier no-cero columna vector z con las entradas reales a y b , uno tiene
${\ displaystyle \ mathbf {z} ^ {\ textsf {T}} I \ mathbf {z} = {\ begin {bmatrix} a & b \ end {bmatrix}} {\ begin {bmatrix} 1 & 0 \\ 0 & 1 \ end {bmatrix }} {\ begin {bmatrix} a \\ b \ end {bmatrix}} = a ^ {2} + b ^ {2}}$ .
Visto como una matriz compleja, por cualquier no-cero columna vector z con entradas complejas un y b uno tiene
${\ Displaystyle \ mathbf {z} ^ {*} I \ mathbf {z} = {\ begin {bmatrix} {\ overline {a}} & {\ overline {b}} \ end {bmatrix}} {\ begin { bmatrix} 1 & 0 \\ 0 & 1 \ end {bmatrix}} {\ begin {bmatrix} a \\ b \ end {bmatrix}} = {\ overline {a}} a + {\ overline {b}} b = | a | ^ {2} + | b | ^ {2}}$ .
De cualquier manera, el resultado es positivo ya que ${\ Displaystyle \ mathbf {z}}$ no es el vector cero (es decir, al menos uno de ${\ Displaystyle a}$ y ${\ Displaystyle b}$ no es cero).
La verdadera matriz simétrica
${\ displaystyle M = {\ begin {bmatrix} 2 & -1 & 0 \\ - 1 & 2 & -1 \\ 0 & -1 & 2 \ end {bmatrix}}}$
es definida positiva ya que para cualquier columna vector no nulo z con las entradas de un , b y c , tenemos
${\ Displaystyle {\ begin {alineado} \ mathbf {z} ^ {\ textsf {T}} M \ mathbf {z} = \ left (\ mathbf {z} ^ {\ textsf {T}} M \ right) \ mathbf {z} & = {\ begin {bmatrix} (2a-b) & (- a + 2b-c) & (- b + 2c) \ end {bmatrix}} {\ begin {bmatrix} a \\ b \ \ c \ end {bmatrix}} \\ & = (2a-b) a + (- a + 2b-c) b + (- b + 2c) c \\ & = 2a ^ {2} -ba-ab + 2b ^ {2} -cb-bc + 2c ^ {2} \\ & = 2a ^ {2} -2ab + 2b ^ {2} -2bc + 2c ^ {2} \\ & = a ^ {2} + a ^ {2} -2ab + b ^ {2} + b ^ {2} -2bc + c ^ {2} + c ^ {2} \\ & = a ^ {2} + (ab) ^ {2} + ( bc) ^ {2} + c ^ {2} \ end {alineado}}}$
Este resultado es una suma de cuadrados y, por lo tanto, no es negativo; y es cero solo si ${\ Displaystyle a = b = c = 0}$ , es decir, cuando z es el vector cero.
Para cualquier matriz invertible real ${\ Displaystyle A}$ , el producto ${\ Displaystyle A ^ {\ textsf {T}} A}$ es una matriz definida positiva (si las medias de las columnas de A son 0, también se denomina matriz de covarianza ). Una prueba simple es que para cualquier vector distinto de cero ${\ Displaystyle \ mathbf {z}}$ , la condición ${\ Displaystyle \ mathbf {z} ^ {\ textsf {T}} A ^ {\ textsf {T}} A \ mathbf {z} = (A \ mathbf {z}) ^ {\ textsf {T}} (A \ mathbf {z}) = \ | A \ mathbf {z} \ | ^ {2}> 0,}$ ya que la invertibilidad de la matriz ${\ Displaystyle A}$ significa que ${\ Displaystyle A \ mathbf {z} \ neq 0.}$
El ejemplo ${\ Displaystyle M}$ arriba muestra que una matriz en la que algunos elementos son negativos aún puede ser definida positiva. Por el contrario, una matriz cuyas entradas son todas positivas no es necesariamente definida positiva, como por ejemplo
${\ displaystyle N = {\ begin {bmatrix} 1 & 2 \\ 2 & 1 \ end {bmatrix}},}$
para cual ${\ displaystyle {\ begin {bmatrix} -1 & 1 \ end {bmatrix}} N {\ begin {bmatrix} -1 & 1 \ end {bmatrix}} ^ {\ textsf {T}} = - 2 <0.}$

Autovalores

Dejar ${\ Displaystyle M}$ frijol ${\ Displaystyle n \ times n}$ Matriz hermitiana . Esto implica que todos sus valores propios son reales.

${\ Displaystyle M}$ es positivo definido si y solo si todos sus valores propios son positivos.
${\ Displaystyle M}$ es positivo semi-definido si y solo si todos sus valores propios son no negativos.
${\ Displaystyle M}$ es negativo definido si y solo si todos sus valores propios son negativos
${\ Displaystyle M}$ es semi-definido negativo si y solo si todos sus valores propios son no positivos.
${\ Displaystyle M}$ es indefinido si y solo si tiene valores propios positivos y negativos.

Dejar ${\ Displaystyle PDP ^ {- 1}}$ ser una descomposición propia de ${\ Displaystyle M}$ , dónde ${\ Displaystyle P}$ es una matriz compleja unitaria cuyas columnas comprenden una base ortonormal de vectores propios de ${\ Displaystyle M}$ , y ${\ Displaystyle D}$ es una matriz diagonal real cuya diagonal principal contiene los valores propios correspondientes . La matriz ${\ Displaystyle M}$ puede considerarse como una matriz diagonal ${\ Displaystyle D}$ que ha sido reexpresado en coordenadas de la base (vectores propios) ${\ Displaystyle P}$ . Dicho de otra manera, aplicar M a algún vector z en nuestro sistema de coordenadas ( M z ), es lo mismo que cambiar la base de nuestra z al sistema de coordenadas del vector propio usando P ⁻¹ ( P ⁻¹z ), aplicando la transformación de estiramiento D a it ( DP ⁻¹z ), y luego volviendo a cambiar la base a nuestro sistema usando P ( PDP ⁻¹z ).

Teniendo esto en cuenta, el cambio de variable uno a uno ${\ Displaystyle \ mathbf {y} = P \ mathbf {z}}$ muestra que ${\ Displaystyle \ mathbf {z} ^ {*} M \ mathbf {z}}$ es real y positivo para cualquier vector complejo ${\ Displaystyle \ mathbf {z}}$ si y solo si ${\ Displaystyle \ mathbf {y} ^ {*} D \ mathbf {y}}$ es real y positivo para cualquier ${\ Displaystyle y}$ ; en otras palabras, si ${\ Displaystyle D}$ es positivo definido. Para una matriz diagonal, esto es cierto solo si cada elemento de la diagonal principal, es decir, cada valor propio de ${\ Displaystyle M}$ -es positivo. Dado que el teorema espectral garantiza que todos los valores propios de una matriz hermitiana son reales, la positividad de los valores propios se puede comprobar utilizando la regla de Descartes de signos alternos cuando el polinomio característico de una matriz simétrica real ${\ Displaystyle M}$ está disponible.

Descomposición

Dejar ${\ Displaystyle M}$ frijol ${\ Displaystyle n \ times n}$ Matriz hermitiana . ${\ Displaystyle M}$ es positivo semidefinido si y solo si puede descomponerse como un producto

{\ Displaystyle M = B ^ {*} B}

de una matriz ${\ Displaystyle B}$ con su transposición conjugada .

Cuándo ${\ Displaystyle M}$ es real, ${\ Displaystyle B}$ también puede ser real y la descomposición se puede escribir como

{\ displaystyle M = B ^ {\ textsf {T}} B.}

${\ Displaystyle M}$ es positivo definido si y sólo si existe tal descomposición con ${\ Displaystyle B}$ invertible . Más generalmente, ${\ Displaystyle M}$ es positivo semidefinido con rango ${\ Displaystyle k}$ si y solo si existe una descomposición con un ${\ Displaystyle k \ times n}$ matriz ${\ Displaystyle B}$ de rango de fila completo (es decir, de rango ${\ Displaystyle k}$ ). Además, para cualquier descomposición ${\ Displaystyle M = B ^ {*} B}$ , ${\ Displaystyle \ operatorname {rango} (M) = \ operatorname {rango} (B)}$ . ^[2]

Prueba

Si ${\ Displaystyle M = B ^ {*} B}$ , luego ${\ Displaystyle x ^ {*} Mx = (x ^ {*} B ^ {*}) (Bx) = \ | Bx \ | ^ {2} \ geq 0}$ , entonces ${\ Displaystyle M}$ es semidefinido positivo. Si ademas ${\ Displaystyle B}$ es invertible, entonces la desigualdad es estricta para ${\ Displaystyle x \ neq 0}$ , entonces ${\ Displaystyle M}$ es positivo definido. Si ${\ Displaystyle B}$ es ${\ Displaystyle k \ times n}$ de rango ${\ Displaystyle k}$ , luego ${\ Displaystyle \ operatorname {rango} (M) = \ operatorname {rango} (B ^ {*}) = k}$ .

En la otra dirección, suponga ${\ Displaystyle M}$ es semidefinido positivo. Desde ${\ Displaystyle M}$ es hermitiano, tiene una descomposición propia ${\ Displaystyle M = Q ^ {- 1} DQ}$ dónde ${\ displaystyle Q}$ es unitario y ${\ Displaystyle D}$ es una matriz diagonal cuyas entradas son los valores propios de ${\ Displaystyle M}$ Desde ${\ Displaystyle M}$ es semidefinido positivo, los valores propios son números reales no negativos, por lo que se puede definir ${\ Displaystyle D ^ {\ frac {1} {2}}}$ como la matriz diagonal cuyas entradas son raíces cuadradas no negativas de valores propios. Luego ${\ Displaystyle M = Q ^ {- 1} DQ = Q ^ {*} DQ = Q ^ {*} D ^ {\ frac {1} {2}} D ^ {\ frac {1} {2}} Q = Q ^ {*} D ^ {{\ frac {1} {2}} *} D ^ {\ frac {1} {2}} Q = B ^ {*} B}$ por ${\ Displaystyle B = D ^ {\ frac {1} {2}} Q}$ . Si ademas ${\ Displaystyle M}$ es positivo definido, entonces los valores propios son (estrictamente) positivos, por lo que ${\ Displaystyle D ^ {\ frac {1} {2}}}$ es invertible, y por lo tanto ${\ Displaystyle B = D ^ {\ frac {1} {2}} Q}$ también es invertible. Si ${\ Displaystyle M}$ tiene rango ${\ Displaystyle k}$ , entonces tiene exactamente ${\ Displaystyle k}$ valores propios positivos y los otros son cero, por lo tanto, en ${\ Displaystyle B = D ^ {\ frac {1} {2}} Q}$ todo pero ${\ Displaystyle k}$ todas las filas se ponen a cero. Cortar las filas cero da una ${\ Displaystyle k \ times n}$ matriz ${\ Displaystyle B '}$ tal que ${\ Displaystyle B '^ {*} B' = B ^ {*} B = M}$ .

Las columnas ${\ Displaystyle b_ {1}, \ dots, b_ {n}}$ de ${\ Displaystyle B}$ pueden verse como vectores en el espacio vectorial complejo o real ${\ Displaystyle \ mathbb {R} ^ {k}}$ , respectivamente. Entonces las entradas de ${\ Displaystyle M}$ son productos internos (es decir , productos escalares , en el caso real) de estos vectores

{\ Displaystyle M_ {ij} = \ langle b_ {i}, b_ {j} \ rangle.}

En otras palabras, una matriz hermitiana ${\ Displaystyle M}$ es semidefinido positivo si y solo si es la matriz de Gram de algunos vectores ${\ Displaystyle b_ {1}, \ dots, b_ {n}}$ . Es positivo definido si y solo si es la matriz de Gram de algunos vectores linealmente independientes . En general, el rango de la matriz de Gram de vectores ${\ Displaystyle b_ {1}, \ dots, b_ {n}}$ es igual a la dimensión del espacio atravesado por estos vectores. ^[3]

Singularidad hasta transformaciones unitarias

La descomposición no es única: si ${\ Displaystyle M = B ^ {*} B}$ para algunos ${\ Displaystyle k \ times n}$ matriz ${\ Displaystyle B}$ y si ${\ displaystyle Q}$ es unitario ${\ Displaystyle k \ times k}$ matriz (significado ${\ Displaystyle Q ^ {*} Q = QQ ^ {*} = I}$ ), luego ${\ Displaystyle M = B ^ {*} B = B ^ {*} Q ^ {*} QB = A ^ {*} A}$ por ${\ Displaystyle A = QB}$ .

Sin embargo, esta es la única forma en que dos descomposiciones pueden diferir: la descomposición es única hasta transformaciones unitarias . Más formalmente, si ${\ Displaystyle A}$ es un ${\ Displaystyle k \ times n}$ matriz y ${\ Displaystyle B}$ es un ${\ Displaystyle \ ell \ times n}$ matriz tal que ${\ Displaystyle A ^ {*} A = B ^ {*} B}$ , entonces hay un ${\ Displaystyle \ ell \ times k}$ matriz ${\ displaystyle Q}$ con columnas ortonormales (es decir ${\ Displaystyle Q ^ {*} Q = I_ {k \ times k}}$ ) tal que ${\ Displaystyle B = QA}$ . ^[4] Cuando ${\ Displaystyle \ ell = k}$ esto significa ${\ displaystyle Q}$ es unitario .

Esta declaración tiene una interpretación geométrica intuitiva en el caso real: deje que las columnas de ${\ Displaystyle A}$ y ${\ Displaystyle B}$ ser los vectores ${\ Displaystyle a_ {1}, \ dots, a_ {n}}$ y ${\ Displaystyle b_ {1}, \ dots, b_ {n}}$ en ${\ Displaystyle \ mathbb {R} ^ {k}}$ . Una matriz unitaria real es una matriz ortogonal , que describe una transformación rígida (una isometría del espacio euclidiano ${\ Displaystyle \ mathbb {R} ^ {k}}$ ) preservando el punto 0 (es decir, rotaciones y reflexiones , sin traslaciones). Por lo tanto, los productos punto ${\ Displaystyle a_ {i} \ cdot a_ {j}}$ y ${\ Displaystyle b_ {i} \ cdot b_ {j}}$ son iguales si y solo si alguna transformación rígida de ${\ Displaystyle \ mathbb {R} ^ {k}}$ transforma los vectores ${\ Displaystyle a_ {1}, \ dots, a_ {n}}$ a ${\ Displaystyle b_ {1}, \ dots, b_ {n}}$ (y de 0 a 0).

Raíz cuadrada

Una matriz ${\ Displaystyle M}$ es semidefinito positivo si y solo si hay una matriz semidefinita positiva ${\ Displaystyle B}$ (En particular ${\ Displaystyle B}$ es hermitiano, entonces ${\ Displaystyle B ^ {*} = B}$ ) satisfactorio ${\ Displaystyle M = BB}$ . Esta matriz ${\ Displaystyle B}$ es única, ^[5] se llama raíz cuadrada no negativa de ${\ Displaystyle M}$ , y se denota con ${\ Displaystyle B = M ^ {\ frac {1} {2}}}$ . Cuándo ${\ Displaystyle M}$ es positivo definido, también lo es ${\ Displaystyle M ^ {\ frac {1} {2}}}$ , de ahí que también se le llame la raíz cuadrada positiva de ${\ Displaystyle M}$ .

La raíz cuadrada no negativa no debe confundirse con otras descomposiciones ${\ Displaystyle M = B ^ {*} B}$ . Algunos autores usan el nombre raíz cuadrada y ${\ Displaystyle M ^ {\ frac {1} {2}}}$ para cualquier tal descomposición, o específicamente para la descomposición de Cholesky , o cualquier descomposición de la forma ${\ Displaystyle M = BB}$ ; otros solo lo usan para la raíz cuadrada no negativa.

Si ${\ Displaystyle M> N> 0}$ luego ${\ Displaystyle M ^ {\ frac {1} {2}}> N ^ {\ frac {1} {2}}> 0}$ .

Descomposición de Cholesky

Una matriz semidefinida positiva ${\ Displaystyle M}$ Se puede escribir como ${\ Displaystyle M = LL ^ {*}}$ , dónde ${\ Displaystyle L}$ es triangular inferior con diagonal no negativa (equivalentemente ${\ Displaystyle M = B ^ {*} B}$ dónde ${\ Displaystyle B = L ^ {*}}$ es triangular superior); esta es la descomposición de Cholesky . Si ${\ Displaystyle M}$ es definida positiva, entonces la diagonal de ${\ Displaystyle L}$ es positivo y la descomposición de Cholesky es única. La descomposición de Cholesky es especialmente útil para cálculos numéricos eficientes. Una descomposición estrechamente relacionada es la descomposición de LDL , ${\ Displaystyle M = LDL ^ {*}}$ , dónde ${\ Displaystyle D}$ es diagonal y ${\ Displaystyle L}$ es triangular unitario inferior .

Otras caracterizaciones

Dejar ${\ Displaystyle M}$ frijol ${\ Displaystyle n \ times n}$ Matriz hermitiana . Las siguientes propiedades son equivalentes a ${\ Displaystyle M}$ siendo positivo definido:

La forma sesquilínea asociada es un producto interno.: La forma sesquilínea definida por ${\ Displaystyle M}$ es la funcion ${\ Displaystyle \ langle \ cdot, \ cdot \ rangle}$ de ${\ Displaystyle \ mathbb {C} ^ {n} \ times \ mathbb {C} ^ {n}}$ a ${\ Displaystyle \ mathbb {C} ^ {n}}$ tal que ${\ Displaystyle \ langle x, y \ rangle: = y ^ {*} Mx}$ para todos ${\ Displaystyle x}$ y ${\ Displaystyle y}$ en ${\ Displaystyle \ mathbb {C} ^ {n}}$ , dónde ${\ Displaystyle y ^ {*}}$ es la transposición conjugada de ${\ Displaystyle y}$ . Para cualquier matriz compleja ${\ Displaystyle M}$ , esta forma es lineal en ${\ Displaystyle x}$ y semilineal en ${\ Displaystyle y}$ . Por lo tanto, la forma es un producto interno en ${\ Displaystyle \ mathbb {C} ^ {n}}$ si y solo si ${\ Displaystyle \ langle z, z \ rangle}$ es real y positivo para todo distinto de cero ${\ Displaystyle z}$ ; eso es si y solo si ${\ Displaystyle M}$ es positivo definido. (De hecho, cada producto interno en ${\ Displaystyle \ mathbb {C} ^ {n}}$ surge de esta manera de una matriz definida positiva hermitiana.)
Sus principales menores principales son todos positivos: El k- ésimo menor principal principal de una matriz ${\ Displaystyle M}$ es el determinante de su parte superior izquierda ${\ Displaystyle k \ times k}$ submatriz. Resulta que una matriz es positiva definida si y solo si todos estos determinantes son positivos. Esta condición se conoce como criterio de Sylvester y proporciona una prueba eficaz de la definición positiva de una matriz real simétrica. Es decir, la matriz se reduce a una matriz triangular superior mediante el uso de operaciones de fila elementales , como en la primera parte del método de eliminación de Gauss , teniendo cuidado de preservar el signo de su determinante durante el proceso de pivote . Dado que el k- ésimo menor principal principal de una matriz triangular es el producto de sus elementos diagonales hasta la fila ${\ Displaystyle k}$ , El criterio de Sylvester equivale a comprobar si sus elementos diagonales son todos positivos. Esta condición se puede comprobar cada vez que una nueva fila ${\ Displaystyle k}$ de la matriz triangular se obtiene.

Una matriz semidefinida positiva es definida positiva si y solo si es invertible . ^[6] Una matriz ${\ Displaystyle M}$ es negativo (semi) definido si y solo si ${\ Displaystyle -M}$ es positivo (semi) definido.

Formas cuadráticas

La forma (puramente) cuadrática asociada con un real ${\ Displaystyle n \ times n}$ matriz ${\ Displaystyle M}$ es la funcion ${\ Displaystyle Q: \ mathbb {R} ^ {n} \ to \ mathbb {R}}$ tal que ${\ Displaystyle Q (x) = x ^ {\ textsf {T}} Mx}$ para todos ${\ Displaystyle x}$ . ${\ Displaystyle M}$ puede asumirse simétrico reemplazándolo con ${\ Displaystyle {\ tfrac {1} {2}} \ left (M + M ^ {\ textsf {T}} \ right)}$ .

Una matriz simétrica ${\ Displaystyle M}$ es positivo definido si y solo si su forma cuadrática es una función estrictamente convexa .

De manera más general, cualquier función cuadrática de ${\ Displaystyle \ mathbb {R} ^ {n}}$ a ${\ Displaystyle \ mathbb {R}}$ Se puede escribir como ${\ displaystyle x ^ {\ textsf {T}} Mx + x ^ {\ textsf {T}} b + c}$ dónde ${\ Displaystyle M}$ es simétrico ${\ Displaystyle n \ times n}$ matriz, ${\ Displaystyle b}$ es un real ${\ Displaystyle n}$ -vector y ${\ Displaystyle c}$ una verdadera constante. Esta función cuadrática es estrictamente convexa y, por tanto, tiene un mínimo global finito único, si y sólo si ${\ Displaystyle M}$ es positivo definido. Por esta razón, las matrices definidas positivas juegan un papel importante en los problemas de optimización .

Diagonalización simultánea

Una matriz simétrica y otra matriz definida simétrica y positiva se pueden diagonalizar simultáneamente , aunque no necesariamente mediante una transformación de similitud . Este resultado no se extiende al caso de tres o más matrices. En esta sección escribimos para el caso real. La extensión al caso complejo es inmediata.

Dejar ${\ Displaystyle M}$ ser simétrico y ${\ Displaystyle N}$ una matriz definida simétrica y positiva. Escriba la ecuación de valor propio generalizada como ${\ Displaystyle \ left (M- \ lambda N \ right) \ mathbf {x} = 0}$ donde imponemos eso ${\ Displaystyle x}$ estar normalizado, es decir ${\ Displaystyle \ mathbf {x} ^ {\ textsf {T}} N \ mathbf {x} = 1}$ . Ahora usamos la descomposición de Cholesky para escribir el inverso de ${\ Displaystyle N}$ como ${\ Displaystyle Q ^ {\ textsf {T}} Q}$ . Multiplicar por ${\ displaystyle Q}$ y dejando ${\ Displaystyle \ mathbf {x} = Q ^ {\ textsf {T}} \ mathbf {y}}$ , obtenemos ${\ Displaystyle Q \ left (M- \ lambda N \ right) Q ^ {\ textsf {T}} \ mathbf {y} = 0}$ , que se puede reescribir como ${\ Displaystyle \ left (QMQ ^ {\ textsf {T}} \ right) \ mathbf {y} = \ lambda \ mathbf {y}}$ dónde ${\ Displaystyle \ mathbf {y} ^ {\ textsf {T}} \ mathbf {y} = 1}$ . La manipulación ahora cede ${\ Displaystyle MX = NX \ Lambda}$ dónde ${\ Displaystyle X}$ es una matriz que tiene como columnas los vectores propios generalizados y ${\ Displaystyle \ Lambda}$ es una matriz diagonal de los valores propios generalizados. Ahora premultiplicación con ${\ Displaystyle X ^ {\ textsf {T}}}$ da el resultado final: ${\ Displaystyle X ^ {\ textsf {T}} MX = \ Lambda}$ y ${\ Displaystyle X ^ {\ textsf {T}} NX = I}$ , pero tenga en cuenta que esto ya no es una diagonalización ortogonal con respecto al producto interno donde ${\ Displaystyle \ mathbf {y} ^ {\ textsf {T}} \ mathbf {y} = 1}$ . De hecho, diagonalizamos ${\ Displaystyle M}$ con respecto al producto interno inducido por ${\ Displaystyle N}$ . ^[7]

Nótese que este resultado no contradice lo que se dice sobre la diagonalización simultánea en el artículo Matriz diagonalizable , que se refiere a la diagonalización simultánea por una transformación de similitud. Nuestro resultado aquí es más parecido a una diagonalización simultánea de dos formas cuadráticas, y es útil para la optimización de una forma bajo condiciones en la otra.

Propiedades

Ordenamiento parcial inducido

Para matrices cuadradas arbitrarias ${\ Displaystyle M}$ , ${\ Displaystyle N}$ nosotros escribimos ${\ Displaystyle M \ geq N}$ Si ${\ Displaystyle MN \ geq 0}$ es decir, ${\ Displaystyle MN}$ es positivo semi-definido. Esto define un ordenamiento parcial en el conjunto de todas las matrices cuadradas. De manera similar, se puede definir un orden parcial estricto ${\ Displaystyle M> N}$ . El pedido se denomina pedido de Loewner .

Inversa de la matriz definida positiva

Toda matriz definida positiva es invertible y su inversa también es definida positiva. ^[8] Si ${\ Displaystyle M \ geq N> 0}$ luego ${\ Displaystyle N ^ {- 1} \ geq M ^ {- 1}> 0}$ . ^[9] Además, según el teorema mínimo-máximo , el k- ésimo valor propio más grande de ${\ Displaystyle M}$ es mayor que el k- ésimo valor propio más grande de ${\ Displaystyle N}$ .

Escalada

Si ${\ Displaystyle M}$ es positivo definido y ${\ Displaystyle r> 0}$ es un número real, entonces ${\ Displaystyle rM}$ es positivo definido. ^[10]

Adición

Si ${\ Displaystyle M}$ y ${\ Displaystyle N}$ son positivas-definidas, entonces la suma ${\ Displaystyle M + N}$ también es positivo-definido. ^[10]
Si ${\ Displaystyle M}$ y ${\ Displaystyle N}$ son positivas-semidefinidas, entonces la suma ${\ Displaystyle M + N}$ también es positivo-semidefinito.
Si ${\ Displaystyle M}$ es positivo-definido y ${\ Displaystyle N}$ es positivo-semidefinito, entonces la suma ${\ Displaystyle M + N}$ también es positivo-definido.

Multiplicación

Si ${\ Displaystyle M}$ y ${\ Displaystyle N}$ son positivos definidos, entonces los productos ${\ Displaystyle MNM}$ y ${\ Displaystyle NMN}$ también son positivas definidas. Si ${\ Displaystyle MN = NM}$ , luego ${\ Displaystyle MN}$ también es positivo definido.
Si ${\ Displaystyle M}$ es positivo semidefinido, entonces ${\ Displaystyle A ^ {*} MA}$ es semidefinido positivo para cualquier matriz (posiblemente rectangular) ${\ Displaystyle A}$ . Si ${\ Displaystyle M}$ es positivo definido y ${\ Displaystyle A}$ tiene rango de columna completo, entonces ${\ Displaystyle A ^ {*} MA}$ es positivo definido. ^[11]

Submatrices

Cada submatriz principal de una matriz definida positiva es definida positiva.

Rastro

Las entradas diagonales ${\ Displaystyle m_ {ii}}$ de una matriz semidefinida positiva son reales y no negativos. Como consecuencia, el rastro , ${\ Displaystyle \ operatorname {tr} (M) \ geq 0}$ . Además, ^[12] dado que cada submatriz principal (en particular, 2 por 2) es semidefinida positiva,

{\ Displaystyle \ left | m_ {ij} \ right | \ leq {\ sqrt {m_ {ii} m_ {jj}}} \ quad \ forall i, j}

y así, cuando ${\ Displaystyle n \ geq 1}$ ,

{\ Displaystyle \ max _ {i, j} \ left | m_ {ij} \ right | \ leq \ max _ {i} m_ {ii}}

Un ${\ Displaystyle n \ times n}$ Matriz hermitiana ${\ Displaystyle M}$ es positivo definido si satisface las siguientes desigualdades de trazas: ^[13]

{\ Displaystyle \ operatorname {tr} (M)> 0 \ quad \ mathrm {y} \ quad {\ frac {(\ operatorname {tr} (M)) ^ {2}} {\ operatorname {tr} (M ^ {2})}}> n-1.}

Otro resultado importante es que para cualquier ${\ Displaystyle M}$ y ${\ Displaystyle N}$ matrices positivas-semidefinidas, ${\ Displaystyle \ operatorname {tr} (MN) \ geq 0}$

Producto Hadamard

Si ${\ Displaystyle M, N \ geq 0}$ , aunque ${\ Displaystyle MN}$ no es necesario semidefinito positivo, el producto de Hadamard es, ${\ Displaystyle M \ circ N \ geq 0}$ (este resultado a menudo se denomina teorema del producto de Schur ). ^[14]

Respecto al producto de Hadamard de dos matrices semidefinitas positivas ${\ Displaystyle M = (m_ {ij}) \ geq 0}$ , ${\ Displaystyle N \ geq 0}$ , hay dos desigualdades notables:

Desigualdad de Oppenheim: ${\ Displaystyle \ det (M \ circ N) \ geq \ det (N) \ prod \ nolimits _ {i} m_ {ii}.}$ ^[15]
${\ Displaystyle \ det (M \ circ N) \ geq \ det (M) \ det (N)}$ . ^[dieciséis]

Producto Kronecker

Si ${\ Displaystyle M, N \ geq 0}$ , aunque ${\ Displaystyle MN}$ no es necesario semidefinito positivo, el producto Kronecker ${\ Displaystyle M \ otimes N \ geq 0}$ .

Producto Frobenius

Si ${\ Displaystyle M, N \ geq 0}$ , aunque ${\ Displaystyle MN}$ no es necesario semidefinito positivo, el producto de Frobenius ${\ Displaystyle M: N \ geq 0}$ (Lancaster-Tismenetsky, The Theory of Matrices , pág. 218).

Convexidad

El conjunto de matrices simétricas semidefinidas positivas es convexo . Es decir, si ${\ Displaystyle M}$ y ${\ Displaystyle N}$ son semidefinidos positivos, entonces para cualquier ${\ Displaystyle \ alpha}$ entre 0 y 1, ${\ Displaystyle \ alpha M + \ left (1- \ alpha \ right) N}$ también es positivo semidefinido. Para cualquier vector ${\ Displaystyle \ mathbf {x}}$ :

{\ Displaystyle \ mathbf {x} ^ {\ textsf {T}} \ left (\ alpha M + \ left (1- \ alpha \ right) N \ right) \ mathbf {x} = \ alpha \ mathbf {x} ^ {\ textsf {T}} M \ mathbf {x} + (1- \ alpha) \ mathbf {x} ^ {\ textsf {T}} N \ mathbf {x} \ geq 0.}

Esta propiedad garantiza que los problemas de programación semidefinidos converjan en una solución óptima globalmente.

Relación con el coseno

La definición positiva de una matriz ${\ Displaystyle A}$ expresa que el ángulo ${\ Displaystyle \ theta}$ entre cualquier vector ${\ Displaystyle \ mathbf {x}}$ y su imagen ${\ Displaystyle A \ mathbf {x}}$ es siempre ${\ Displaystyle - \ pi / 2 <\ theta <+ \ pi / 2}$ :

{\ Displaystyle \ cos \ theta = {\ frac {\ mathbf {x} ^ {T} A \ mathbf {x}} {\ lVert \ mathbf {x} \ rVert \ lVert A \ mathbf {x} \ rVert}} = {\ frac {\ langle \ mathbf {x}, A \ mathbf {x} \ rangle} {\ lVert \ mathbf {x} \ rVert \ lVert A \ mathbf {x} \ rVert}}, \ theta = \ theta (\ mathbf {x}, A \ mathbf {x}) = {\ widehat {\ mathbf {x}, A \ mathbf {x}}} = {\ text {el ángulo entre}} \ mathbf {x} {\ texto {y}} A \ mathbf {x}}

Otras propiedades

Si ${\ Displaystyle M}$ es una matriz de Toeplitz simétrica , es decir, las entradas ${\ Displaystyle m_ {ij}}$ se dan en función de sus diferencias de índice absolutas: ${\ Displaystyle m_ {ij} = h (| ij |)}$ , y la estricta desigualdad ${\ textstyle \ sum _ {j \ neq 0} \ left | h (j) \ right |$ aguanta, entonces ${\ Displaystyle M}$ es estrictamente positivo definido.
Dejar ${\ Displaystyle M> 0}$ y ${\ Displaystyle N}$ Hermitian. Si ${\ Displaystyle MN + NM \ geq 0}$ (resp., ${\ Displaystyle MN + NM> 0}$ ) luego ${\ Displaystyle N \ geq 0}$ (resp., ${\ Displaystyle N> 0}$ ). ^[17]
Si ${\ Displaystyle M> 0}$ es real, entonces hay un ${\ Displaystyle \ delta> 0}$ tal que ${\ Displaystyle M> \ delta I}$ , dónde ${\ Displaystyle I}$ es la matriz de identidad .
Si ${\ Displaystyle M_ {k}}$ denota el líder ${\ Displaystyle k \ times k}$ menor, ${\ Displaystyle \ det \ left (M_ {k} \ right) / \ det \ left (M_ {k-1} \ right)}$ es el k- ésimo pivote durante la descomposición LU .
Una matriz es definida negativa si su k- ésimo orden principal principal menor es negativo cuando ${\ Displaystyle k}$ es extraño y positivo cuando ${\ Displaystyle k}$ incluso.

Una matriz hermitiana es semidefinida positiva si y solo si todos sus principales menores son no negativos. Sin embargo, no es suficiente considerar solo a los principales menores principales, como se verifica en la matriz diagonal con las entradas 0 y -1.

Matrices de bloques

Un positivo ${\ Displaystyle 2n \ times 2n}$ La matriz también puede estar definida por bloques :

{\ Displaystyle M = {\ begin {bmatrix} A&B \\ C&D \ end {bmatrix}}}

donde está cada bloque ${\ Displaystyle n \ times n}$ . Al aplicar la condición de positividad, se sigue inmediatamente que ${\ Displaystyle A}$ y ${\ Displaystyle D}$ son ermitaños, y ${\ Displaystyle C = B ^ {*}}$ .

Tenemos eso ${\ Displaystyle \ mathbf {z} ^ {*} M \ mathbf {z} \ geq 0}$ para todo complejo ${\ Displaystyle \ mathbf {z}}$ , y en particular para ${\ Displaystyle \ mathbf {z} = [\ mathbf {v}, 0] ^ {\ textsf {T}}}$ . Luego

{\ displaystyle {\ begin {bmatrix} \ mathbf {v} ^ {*} & 0 \ end {bmatrix}} {\ begin {bmatrix} A&B \\ B ^ {*} & D \ end {bmatrix}} {\ begin { bmatrix} \ mathbf {v} \\ 0 \ end {bmatrix}} = \ mathbf {v} ^ {*} A \ mathbf {v} \ geq 0.}

Se puede aplicar un argumento similar a ${\ Displaystyle D}$ , y así concluimos que tanto ${\ Displaystyle A}$ y ${\ Displaystyle D}$ también deben ser matrices definidas positivas.

Los resultados inversos se pueden demostrar con condiciones más fuertes en los bloques, por ejemplo, utilizando el complemento de Schur .

Extremos locales

Una forma cuadrática general ${\ Displaystyle f (\ mathbf {x})}$ en ${\ Displaystyle n}$ variables reales ${\ Displaystyle x_ {1}, \ ldots, x_ {n}}$ siempre se puede escribir como ${\ Displaystyle \ mathbf {x} ^ {\ textsf {T}} M \ mathbf {x}}$ dónde ${\ Displaystyle \ mathbf {x}}$ es el vector de columna con esas variables, y ${\ Displaystyle M}$ es una matriz real simétrica. Por lo tanto, la matriz es positiva definida significa que ${\ Displaystyle f}$ tiene un mínimo único (cero) cuando ${\ Displaystyle \ mathbf {x}}$ es cero y es estrictamente positivo para cualquier otro ${\ Displaystyle \ mathbf {x}}$ .

De manera más general, una función real dos veces diferenciable ${\ Displaystyle f}$ en ${\ Displaystyle n}$ las variables reales tienen un mínimo local en los argumentos ${\ Displaystyle x_ {1}, \ ldots, x_ {n}}$ si su gradiente es cero y su hessiano (la matriz de todas las segundas derivadas) es semidefinida positiva en ese punto. Se pueden hacer afirmaciones similares para matrices negativas definidas y semidefinidas.

Covarianza

En estadística , la matriz de covarianza de una distribución de probabilidad multivariante es siempre semidefinida positiva; y es definida positiva a menos que una variable sea una función lineal exacta de las demás. Por el contrario, toda matriz semidefinida positiva es la matriz de covarianza de alguna distribución multivariante.

Extensión para matrices cuadradas no hermitianas

La definición de definido positivo se puede generalizar designando cualquier matriz compleja ${\ Displaystyle M}$ (por ejemplo, real no simétrico) como definido positivo si ${\ Displaystyle \ Re \ left (\ mathbf {z} ^ {*} M \ mathbf {z} \ right)> 0}$ para todos los vectores complejos distintos de cero ${\ Displaystyle \ mathbf {z}}$ , dónde ${\ Displaystyle \ Re (c)}$ denota la parte real de un número complejo ${\ Displaystyle c}$ . ^[18] Solo la parte hermitiana ${\ textstyle {\ frac {1} {2}} \ left (M + M ^ {*} \ right)}$ determina si la matriz es positiva definida y se evalúa en el sentido más estricto anterior. Del mismo modo, si ${\ Displaystyle \ mathbf {x}}$ y ${\ Displaystyle M}$ son reales, tenemos ${\ Displaystyle \ mathbf {x} ^ {\ textsf {T}} M \ mathbf {x}> 0}$ para todos los vectores reales distintos de cero ${\ Displaystyle \ mathbf {x}}$ si y solo si la parte simétrica ${\ textstyle {\ frac {1} {2}} \ left (M + M ^ {\ textsf {T}} \ right)}$ es positivo definido en el sentido más estricto. Inmediatamente queda claro que ${\ Displaystyle \ mathbf {x} ^ {\ textsf {T}} M \ mathbf {x} = \ sum _ {ij} x_ {i} M_ {ij} x_ {j}}$ es insensible a la transposición de M .

En consecuencia, una matriz real no simétrica con solo valores propios positivos no necesita ser definida positiva. Por ejemplo, la matriz ${\ displaystyle M = \ left [{\ begin {smallmatrix} 4 y 9 \\ 1 y 4 \ end {smallmatrix}} \ right]}$ tiene valores propios positivos pero no es positivo definido; en particular un valor negativo de ${\ Displaystyle \ mathbf {x} ^ {\ textsf {T}} M \ mathbf {x}}$ se obtiene con la elección ${\ Displaystyle \ mathbf {x} = \ left [{\ begin {smallmatrix} -1 \\ 1 \ end {smallmatrix}} \ right]}$ (que es el vector propio asociado con el valor propio negativo de la parte simétrica de ${\ Displaystyle M}$ ).

En resumen, la característica que distingue entre el caso real y el complejo es que un operador positivo acotado en un espacio de Hilbert complejo es necesariamente hermitiano o autoadjunto. La afirmación general se puede argumentar utilizando la identidad de polarización . Eso ya no es cierto en el caso real.

Aplicaciones

Matriz de conductividad térmica

Ley de Fourier de conducción de calor, que da flujo de calor. ${\ Displaystyle \ mathbf {q}}$ en términos del gradiente de temperatura ${\ Displaystyle \ mathbf {g} = \ nabla T}$ está escrito para medios anisotrópicos como ${\ Displaystyle \ mathbf {q} = -K \ mathbf {g}}$ , en el cual ${\ Displaystyle K}$ es la matriz de conductividad térmica simétrica . El negativo se inserta en la ley de Fourier para reflejar la expectativa de que el calor siempre fluirá de lo caliente a lo frío. En otras palabras, dado que el gradiente de temperatura ${\ Displaystyle \ mathbf {g}}$ siempre apunta de frío a caliente, el flujo de calor ${\ Displaystyle \ mathbf {q}}$ se espera que tenga un producto interno negativo con ${\ Displaystyle \ mathbf {g}}$ así que eso ${\ Displaystyle \ mathbf {q} ^ {\ textsf {T}} \ mathbf {g} <0}$ . Sustituyendo la ley de Fourier se obtiene esta expectativa como ${\ Displaystyle \ mathbf {g} ^ {\ textsf {T}} K \ mathbf {g}> 0}$ , lo que implica que la matriz de conductividad debe ser definida positiva.

Ver también

Matriz de covarianza
Matriz M
Función definida positiva
Núcleo positivo definido
Complemento Schur
El criterio de Sylvester
Rango numérico

Notas

^ "Apéndice C: matrices definidas positivas semidefinidas y positivas" . Estimación de parámetros para científicos e ingenieros : 259–263. doi : 10.1002 / 9780470173862.app3 .
^ Horn y Johnson (2013) , p. 440, Teorema 7.2.7
^ Horn y Johnson (2013) , p. 441, Teorema 7.2.10
^ Horn y Johnson (2013) , p. 452, Teorema 7.3.11
^ Horn y Johnson (2013) , p. 439, Teorema 7.2.6 con ${\ Displaystyle k = 2}$
^ Horn y Johnson (2013) , p. 431, Corolario 7.1.7
^ Horn y Johnson (2013) , p. 485, Teorema 7.6.1
^ Horn y Johnson (2013) , p. 438, Teorema 7.2.1
^ Horn y Johnson (2013) , p. 495, Corolario 7.7.4 (a)
↑ a b Horn y Johnson (2013) , p. 430, Observación 7.1.3
^ Horn y Johnson (2013) , p. 431, Observación 7.1.8
^ Horn y Johnson (2013) , p. 430
^ Wolkowicz, Henry; Styan, George PH (1980). "Límites para valores propios mediante trazas". Álgebra lineal y sus aplicaciones . Elsevier (29): 471–506.
^ Horn y Johnson (2013) , p. 479, Teorema 7.5.3
^ Horn y Johnson (2013) , p. 509, Teorema 7.8.16
^ Styan, GP (1973). "Productos de Hadamard y análisis estadístico multivariado". Álgebra lineal y sus aplicaciones . 6 : 217-240., Corolario 3.6, pág. 227
^ Bhatia, Rajendra (2007). Matrices positivas definidas . Princeton, Nueva Jersey: Princeton University Press. pag. 8. ISBN 978-0-691-12918-1.
^ Weisstein, Eric W. Matriz definida positiva. De MathWorld - Un recurso web de Wolfram . Consultado el 26 de julio de 2012.

Referencias

Horn, Roger A .; Johnson, Charles R. (2013). Análisis matricial (2ª ed.). Prensa de la Universidad de Cambridge . ISBN 978-0-521-54823-6.
Bhatia, Rajendra (2007). Matrices definidas positivas . Serie de Princeton en Matemáticas Aplicadas. ISBN 978-0-691-12918-1.
Bernstein, B .; Toupin, RA (1962). "Algunas propiedades de la matriz de Hesse de una función estrictamente convexa". Journal für die reine und angewandte Mathematik . 210 : 67–72. doi : 10.1515 / crll.1962.210.65 .

enlaces externos

"Forma positiva definida" , Encyclopedia of Mathematics , EMS Press , 2001 [1994]
Wolfram MathWorld: Matriz positiva definida

[1] "Apéndice C: matrices definidas positivas semidefinidas y positivas" . Estimación de parámetros para científicos e ingenieros : 259–263. doi : 10.1002 / 9780470173862.app3 .

[2] Horn y Johnson (2013) , p. 440, Teorema 7.2.7

[3] Horn y Johnson (2013) , p. 441, Teorema 7.2.10

[4] Horn y Johnson (2013) , p. 452, Teorema 7.3.11

[5] Horn y Johnson (2013) , p. 439, Teorema 7.2.6 con ${\ Displaystyle k = 2}$

[6] Horn y Johnson (2013) , p. 431, Corolario 7.1.7

[7] Horn y Johnson (2013) , p. 485, Teorema 7.6.1

[8] Horn y Johnson (2013) , p. 438, Teorema 7.2.1

[9] Horn y Johnson (2013) , p. 495, Corolario 7.7.4 (a)

[HJobs713-10] Horn y Johnson (2013) , p. 430, Observación 7.1.3

[11] Horn y Johnson (2013) , p. 431, Observación 7.1.8

[12] Horn y Johnson (2013) , p. 430

[13] Wolkowicz, Henry; Styan, George PH (1980). "Límites para valores propios mediante trazas". Álgebra lineal y sus aplicaciones . Elsevier (29): 471–506.

[14] Horn y Johnson (2013) , p. 479, Teorema 7.5.3

[15] Horn y Johnson (2013) , p. 509, Teorema 7.8.16

[styan1973-16] Styan, GP (1973). "Productos de Hadamard y análisis estadístico multivariado". Álgebra lineal y sus aplicaciones . 6 : 217-240., Corolario 3.6, pág. 227

[17] Bhatia, Rajendra (2007). Matrices positivas definidas . Princeton, Nueva Jersey: Princeton University Press. pag. 8. ISBN 978-0-691-12918-1.

[mathw-18] Weisstein, Eric W. Matriz definida positiva. De MathWorld - Un recurso web de Wolfram . Consultado el 26 de julio de 2012.

[1]