Proyección (álgebra lineal)

En álgebra lineal y análisis funcional , una proyección es una transformación lineal ${\ Displaystyle P}$ de un espacio vectorial a sí mismo de modo que ${\ Displaystyle P ^ {2} = P}$ . Es decir, siempre que ${\ Displaystyle P}$ se aplica dos veces a cualquier valor, da el mismo resultado que si se aplicara una vez ( idempotente ). Deja su imagen sin cambios. ^[1] Aunque abstracta , esta definición de "proyección" formaliza y generaliza la idea de proyección gráfica . También se puede considerar el efecto de una proyección en un objeto geométrico examinando el efecto de la proyección en puntos del objeto.

La transformación P es la proyección ortogonal sobre la línea m .

Definiciones

Una proyección en un espacio vectorial. ${\ Displaystyle V}$ es un operador lineal ${\ Displaystyle P: V \ a V}$ tal que ${\ Displaystyle P ^ {2} = P}$ .

Cuándo ${\ Displaystyle V}$ tiene un producto interno y está completo (es decir, cuando ${\ Displaystyle V}$ es un espacio de Hilbert ) se puede utilizar el concepto de ortogonalidad . Una proyección ${\ Displaystyle P}$ en un espacio de Hilbert ${\ Displaystyle V}$ se llama proyección ortogonal si satisface ${\ Displaystyle \ langle P \ mathbf {x}, \ mathbf {y} \ rangle = \ langle \ mathbf {x}, P \ mathbf {y} \ rangle}$ para todos ${\ Displaystyle \ mathbf {x}, \ mathbf {y} \ in V}$ . Una proyección en un espacio de Hilbert que no es ortogonal se llama proyección oblicua .

Matriz de proyección

En el caso de dimensión finita, una matriz cuadrada ${\ Displaystyle P}$ se llama matriz de proyección si es igual a su cuadrado, es decir, si ${\ Displaystyle P ^ {2} = P}$ . ^[2]^{: pág. 38}
Una matriz cuadrada ${\ Displaystyle P}$ se llama matriz de proyección ortogonal si ${\ Displaystyle P ^ {2} = P = P ^ {\ mathrm {T}}}$ para una matriz real, y respectivamente ${\ Displaystyle P ^ {2} = P = P ^ {*}}$ para una matriz compleja, donde ${\ Displaystyle P ^ {\ mathrm {T}}}$ denota la transposición de ${\ Displaystyle P}$ y ${\ Displaystyle P ^ {*}}$ denota la transposición adjunta o hermitiana de ${\ Displaystyle P}$ . ^[2]^{: pág. 223}
Una matriz de proyección que no es una matriz de proyección ortogonal se denomina matriz de proyección oblicua .

Los valores propios de una matriz de proyección deben ser 0 o 1.

Ejemplos de

Proyección ortogonal

Por ejemplo, la función que mapea el punto ${\ Displaystyle (x, y, z)}$ en el espacio tridimensional ${\ Displaystyle \ mathbb {R} ^ {3}}$ al punto ${\ displaystyle (x, y, 0)}$ es una proyección ortogonal sobre el plano xy . Esta función está representada por la matriz

{\ displaystyle P = {\ begin {bmatrix} 1 & 0 & 0 \\ 0 & 1 & 0 \\ 0 & 0 & 0 \ end {bmatrix}}.}

La acción de esta matriz sobre un vector arbitrario es

{\ displaystyle P {\ begin {bmatrix} x \\ y \\ z \ end {bmatrix}} = {\ begin {bmatrix} x \\ y \\ 0 \ end {bmatrix}}.}

Para ver eso ${\ Displaystyle P}$ es de hecho una proyección, es decir, ${\ Displaystyle P = P ^ {2}}$ , calculamos

{\ displaystyle P ^ {2} {\ begin {bmatrix} x \\ y \\ z \ end {bmatrix}} = P {\ begin {bmatrix} x \\ y \\ 0 \ end {bmatrix}} = { \ begin {bmatrix} x \\ y \\ 0 \ end {bmatrix}} = P {\ begin {bmatrix} x \\ y \\ z \ end {bmatrix}}}

.

Observando eso ${\ Displaystyle P ^ {\ mathrm {T}} = P}$ muestra que la proyección es una proyección ortogonal.

Proyección oblicua

Un ejemplo simple de una proyección no ortogonal (oblicua) (para la definición, ver más abajo) es

{\ displaystyle P = {\ begin {bmatrix} 0 & 0 \\\ alpha & 1 \ end {bmatrix}}.}

A través de la multiplicación de matrices , uno ve que

{\ displaystyle P ^ {2} = {\ begin {bmatrix} 0 & 0 \\\ alpha & 1 \ end {bmatrix}} {\ begin {bmatrix} 0 & 0 \\\ alpha & 1 \ end {bmatrix}} = {\ begin { bmatrix} 0 & 0 \\\ alpha & 1 \ end {bmatrix}} = P.}

demostrando que ${\ Displaystyle P}$ es de hecho una proyección.

La proyección ${\ Displaystyle P}$ es ortogonal si y solo si ${\ Displaystyle \ alpha = 0}$ porque solo entonces ${\ Displaystyle P ^ {\ mathrm {T}} = P}$ .

Propiedades y clasificación

La transformación T es la proyección a lo largo de k sobre m . El rango de T es my el espacio nulo es k .

Idempotencia

Por definición, una proyección ${\ Displaystyle P}$ es idempotente (es decir ${\ Displaystyle P ^ {2} = P}$ ).

Complementariedad de rango y kernel

Dejar ${\ Displaystyle W}$ ser un espacio vectorial de dimensión finita y ${\ Displaystyle P}$ ser una proyección en ${\ Displaystyle W}$ . Supongamos que los subespacios ${\ Displaystyle U}$ y ${\ Displaystyle V}$ son el rango y el núcleo de ${\ Displaystyle P}$ respectivamente. Luego ${\ Displaystyle P}$ tiene las siguientes propiedades:

${\ Displaystyle P}$ es el operador de identidad ${\ Displaystyle I}$ en ${\ Displaystyle U}$
${\ Displaystyle \ forall \ mathbf {x} \ in U: P \ mathbf {x} = \ mathbf {x}}$ .
Tenemos una suma directa ${\ Displaystyle W = U \ oplus V}$ . Cada vector ${\ Displaystyle \ mathbf {x} \ in W}$ puede descomponerse únicamente como ${\ Displaystyle \ mathbf {x} = \ mathbf {u} + \ mathbf {v}}$ con ${\ Displaystyle \ mathbf {u} = P \ mathbf {x}}$ y ${\ Displaystyle \ mathbf {v} = \ mathbf {x} -P \ mathbf {x} = \ left (IP \ right) \ mathbf {x}}$ , y donde ${\ Displaystyle \ mathbf {u} \ en U, \ mathbf {v} \ in V}$ .

El rango y el núcleo de una proyección son complementarios , al igual que ${\ Displaystyle P}$ y ${\ Displaystyle Q = IP}$ . El operador ${\ displaystyle Q}$ es también una proyección como el rango y el núcleo de ${\ Displaystyle P}$ convertirse en el núcleo y la gama de ${\ displaystyle Q}$ y viceversa. Decimos ${\ Displaystyle P}$ es una proyección a lo largo de ${\ Displaystyle V}$ sobre ${\ Displaystyle U}$ (kernel / rango) y ${\ displaystyle Q}$ es una proyección a lo largo de ${\ Displaystyle U}$ sobre ${\ Displaystyle V}$ .

Espectro

En espacios vectoriales de dimensión infinita, el espectro de una proyección está contenido en ${\ Displaystyle \ {0,1 \}}$ como

{\ displaystyle (\ lambda IP) ^ {- 1} = {\ frac {1} {\ lambda}} I + {\ frac {1} {\ lambda (\ lambda -1)}} P.}

Solo 0 o 1 pueden ser un valor propio de una proyección. Esto implica que una proyección ortogonal ${\ Displaystyle P}$ es siempre una matriz semidefinida positiva. En general, los espacios propios correspondientes son (respectivamente) el núcleo y el rango de la proyección. La descomposición de un espacio vectorial en sumas directas no es única. Por lo tanto, dado un subespacio ${\ Displaystyle V}$ , puede haber muchas proyecciones cuyo rango (o kernel) sea ${\ Displaystyle V}$ .

Si una proyección no es trivial, tiene un polinomio mínimo. ${\ Displaystyle x ^ {2} -x = x (x-1)}$ , que influye en raíces distintas, y por lo tanto ${\ Displaystyle P}$ es diagonalizable .

Producto de proyecciones

El producto de las proyecciones no es en general una proyección, incluso si son ortogonales. Si dos proyecciones se conmutan, entonces su producto es una proyección, pero lo contrario es falso: el producto de dos proyecciones que no conmutan puede ser una proyección.

Si dos proyecciones ortogonales se conmutan, su producto es una proyección ortogonal. Si el producto de dos proyecciones ortogonales es una proyección ortogonal, entonces las dos proyecciones ortogonales conmutan (más generalmente: dos endomorfismos autoadjuntos conmutan si y solo si su producto es autoadjunto).

Proyecciones ortogonales

Cuando el espacio vectorial ${\ Displaystyle W}$ tiene un producto interno y es completo (es un espacio de Hilbert ) se puede utilizar el concepto de ortogonalidad . Una proyección ortogonal es una proyección para la cual el rango ${\ Displaystyle U}$ y el espacio nulo ${\ Displaystyle V}$ son subespacios ortogonales . Por lo tanto, para cada ${\ Displaystyle \ mathbf {x}}$ y ${\ Displaystyle \ mathbf {y}}$ en ${\ Displaystyle W}$ , ${\ Displaystyle \ langle P \ mathbf {x}, (\ mathbf {y} -P \ mathbf {y}) \ rangle = \ langle (\ mathbf {x} -P \ mathbf {x}), P \ mathbf { y} \ rangle = 0}$ . Equivalentemente:

{\ Displaystyle \ langle \ mathbf {x}, P \ mathbf {y} \ rangle = \ langle P \ mathbf {x}, P \ mathbf {y} \ rangle = \ langle P \ mathbf {x}, \ mathbf { y} \ rangle.}

Una proyección es ortogonal si y solo si es autoadjunta . Usando las propiedades autoadjuntas e idempotentes de ${\ Displaystyle P}$ , para cualquier ${\ Displaystyle \ mathbf {x}}$ y ${\ Displaystyle \ mathbf {y}}$ en ${\ Displaystyle W}$ tenemos ${\ Displaystyle P \ mathbf {x} \ in U}$ , ${\ Displaystyle \ mathbf {y} -P \ mathbf {y} \ in V}$ , y

{\ Displaystyle \ langle P \ mathbf {x}, \ mathbf {y} -P \ mathbf {y} \ rangle = \ langle P ^ {2} \ mathbf {x}, \ mathbf {y} -P \ mathbf { y} \ rangle = \ langle P \ mathbf {x}, P \ left (IP \ right) \ mathbf {y} \ rangle = \ langle P \ mathbf {x}, \ left (PP ^ {2} \ right) \ mathbf {y} \ rangle = 0}

dónde ${\ Displaystyle \ langle \ cdot, \ cdot \ rangle}$ es el producto interno asociado con ${\ Displaystyle W}$ . Por lo tanto, ${\ Displaystyle P}$ y ${\ Displaystyle IP}$ son proyecciones ortogonales. ^[3] La otra dirección, a saber, que si ${\ Displaystyle P}$ es ortogonal entonces es autoadjunto, se sigue de

{\ Displaystyle \ langle \ mathbf {x}, P \ mathbf {y} \ rangle = \ langle P \ mathbf {x}, \ mathbf {y} \ rangle = \ langle \ mathbf {x}, P ^ {*} \ mathbf {y} \ rangle}

para cada ${\ Displaystyle x}$ y ${\ Displaystyle y}$ en ${\ Displaystyle W}$ ; por lo tanto ${\ Displaystyle P = P ^ {*}}$ .

Prueba de existencia

Dejar ${\ Displaystyle H}$ ser un espacio métrico completo con un producto interno , y dejar ${\ Displaystyle U}$ ser un subespacio lineal cerrado de ${\ Displaystyle H}$ (y, por tanto, también completo).

Para cada ${\ Displaystyle \ mathbf {x}}$ el siguiente conjunto de valores normativos no negativos ${\ Displaystyle \ {\ | \ mathbf {x} - \ mathbf {u} \ | \ mid \ mathbf {u} \ in U \}}$ tiene un mínimo , y debido a la integridad de ${\ Displaystyle U}$ es un mínimo . Definimos ${\ Displaystyle P \ mathbf {x}}$ como el punto en ${\ Displaystyle U}$ donde se obtiene este mínimo.

Obviamente ${\ Displaystyle P \ mathbf {x}}$ es en ${\ Displaystyle U}$ . Queda por demostrar que ${\ Displaystyle P \ mathbf {x}}$ satisface ${\ Displaystyle \ langle \ mathbf {x} -P \ mathbf {x}, P \ mathbf {x} \ rangle = 0}$ y que es lineal.

Definamos ${\ Displaystyle \ mathbf {a} = \ mathbf {x} -P \ mathbf {x}}$ . Por cada distinto de cero ${\ Displaystyle \ mathbf {v}}$ en ${\ Displaystyle U}$ , lo siguiente es válido:

{\ Displaystyle \ left \ | \ mathbf {a} - {\ frac {\ langle \ mathbf {a}, \ mathbf {v} \ rangle} {\ | \ mathbf {v} \ | ^ {2}}} \ mathbf {v} \ right \ | ^ {2} = \ | \ mathbf {a} \ | ^ {2} - {\ frac {{\ langle \ mathbf {a}, \ mathbf {v} \ rangle} ^ { 2}} {\ | \ mathbf {v} \ | ^ {2}}}}

Definiendo ${\ Displaystyle \ mathbf {w} = P \ mathbf {x} + {\ frac {\ langle \ mathbf {a}, \ mathbf {v} \ rangle} {\ | \ mathbf {v} \ | ^ {2} }} \ mathbf {v}}$ vemos eso ${\ Displaystyle \ | \ mathbf {x} - \ mathbf {w} \ | <\ | \ mathbf {x} -P \ mathbf {x} \ |}$ a no ser que ${\ Displaystyle \ langle \ mathbf {a}, \ mathbf {v} \ rangle}$ desaparece. Desde ${\ Displaystyle P \ mathbf {x}}$ fue elegido como el mínimo del conjunto mencionado, de lo que se deduce que ${\ Displaystyle \ langle \ mathbf {a}, \ mathbf {v} \ rangle}$ de hecho desaparece. En particular, (para ${\ Displaystyle \ mathbf {y} = P \ mathbf {x}}$ ): ${\ Displaystyle \ langle \ mathbf {x} -P \ mathbf {x}, P \ mathbf {x} \ rangle = 0}$ .

La linealidad se sigue de la desaparición de ${\ Displaystyle \ langle \ mathbf {x} -P \ mathbf {x}, \ mathbf {v} \ rangle}$ para cada ${\ Displaystyle \ mathbf {v} \ in U}$ :

{\ Displaystyle \ langle \ left (\ mathbf {x} + \ mathbf {y} \ right) -P \ left (\ mathbf {x} + \ mathbf {y} \ right), \ mathbf {v} \ rangle = 0}

{\ Displaystyle \ langle \ left (\ mathbf {x} -P \ mathbf {x} \ right) + \ left (\ mathbf {y} -P \ mathbf {y} \ right), \ mathbf {v} \ rangle = 0}

Al tomar la diferencia entre las ecuaciones tenemos

{\ Displaystyle \ langle P \ mathbf {x} + P \ mathbf {y} -P \ left (\ mathbf {x} + \ mathbf {y} \ right), \ mathbf {v} \ rangle = 0}

Pero ya que podemos elegir ${\ Displaystyle \ mathbf {v} = P \ mathbf {x} + P \ mathbf {y} -P (\ mathbf {x} + \ mathbf {y})}$ (como está en sí mismo en ${\ Displaystyle U}$ ) resulta que ${\ Displaystyle P \ mathbf {x} + P \ mathbf {y} = P (\ mathbf {x} + \ mathbf {y})}$ . Similarmente tenemos ${\ Displaystyle \ lambda P \ mathbf {x} = P (\ lambda \ mathbf {x})}$ por cada escalar ${\ Displaystyle \ lambda}$ .

Propiedades y casos especiales

Una proyección ortogonal es un operador acotado . Esto se debe a que para cada ${\ Displaystyle \ mathbf {v}}$ en el espacio vectorial tenemos, por desigualdad de Cauchy-Schwarz :

{\ Displaystyle \ left \ | P \ mathbf {v} \ right \ | ^ {2} = \ langle P \ mathbf {v}, P \ mathbf {v} \ rangle = \ langle P \ mathbf {v}, \ mathbf {v} \ rangle \ leq \ left \ | P \ mathbf {v} \ right \ | \ cdot \ left \ | \ mathbf {v} \ right \ |}

Por lo tanto ${\ Displaystyle \ left \ | P \ mathbf {v} \ right \ | \ leq \ left \ | \ mathbf {v} \ right \ |}$ .

Para espacios vectoriales complejos o reales de dimensión finita, el producto interno estándar puede ser sustituido por ${\ Displaystyle \ langle \ cdot, \ cdot \ rangle}$ .

Fórmulas

Un caso simple ocurre cuando la proyección ortogonal está sobre una línea. Si ${\ Displaystyle \ mathbf {u}}$ es un vector unitario en la línea, entonces la proyección viene dada por el producto externo

{\ Displaystyle P _ {\ mathbf {u}} = \ mathbf {u} \ mathbf {u} ^ {\ mathrm {T}}.}

(Si ${\ Displaystyle \ mathbf {u}}$ tiene un valor complejo, la transpuesta en la ecuación anterior se reemplaza por una transpuesta hermitiana). Este operador deja u invariante y aniquila todos los vectores ortogonales a ${\ Displaystyle \ mathbf {u}}$ , lo que demuestra que de hecho es la proyección ortogonal sobre la línea que contiene u . ^[4] Una forma sencilla de ver esto es considerar un vector arbitrario ${\ Displaystyle \ mathbf {x}}$ como la suma de un componente en la línea (es decir, el vector proyectado que buscamos) y otro perpendicular a él, ${\ Displaystyle \ mathbf {x} = \ mathbf {x} _ {\ paralelo} + \ mathbf {x} _ {\ perp}}$ . Aplicando proyección, obtenemos

{\ Displaystyle P _ {\ mathbf {u}} \ mathbf {x} = \ mathbf {u} \ mathbf {u} ^ {\ mathsf {T}} \ mathbf {x} _ {\ paralelo} + \ mathbf {u } \ mathbf {u} ^ {\ mathsf {T}} \ mathbf {x} _ {\ perp} = \ mathbf {u} \ left (\ operatorname {sign} (\ mathbf {u} ^ {\ mathsf {T }} \ mathbf {x} _ {\ paralelo}) \ izquierda \ | \ mathbf {x} _ {\ paralelo} \ derecha \ | \ derecha) + \ mathbf {u} \ cdot \ mathbf {0} = \ mathbf {x} _ {\ paralelo}}

por las propiedades del producto escalar de vectores paralelos y perpendiculares.

Esta fórmula se puede generalizar a proyecciones ortogonales en un subespacio de dimensión arbitraria. Dejar ${\ Displaystyle \ mathbf {u} _ {1}, \ ldots, \ mathbf {u} _ {k}}$ ser una base ortonormal del subespacio ${\ Displaystyle U}$ , y deja ${\ Displaystyle A}$ denotar el ${\ Displaystyle n \ times k}$ matriz cuyas columnas son ${\ Displaystyle \ mathbf {u} _ {1}, \ ldots, \ mathbf {u} _ {k}}$ , es decir ${\ Displaystyle A = {\ begin {bmatrix} \ mathbf {u} _ {1} & \ cdots & \ mathbf {u} _ {k} \ end {bmatrix}}}$ . Entonces la proyección viene dada por: ^[5]

{\ Displaystyle P_ {A} = AA ^ {\ mathrm {T}}}

que se puede reescribir como

{\ Displaystyle P_ {A} = \ sum _ {i} \ langle \ mathbf {u} _ {i}, \ cdot \ rangle \ mathbf {u} _ {i}.}

La matriz ${\ Displaystyle A ^ {\ mathrm {T}}}$ es la isometría parcial que desaparece en el complemento ortogonal de ${\ Displaystyle U}$ y ${\ Displaystyle A}$ es la isometría que incrusta ${\ Displaystyle U}$ en el espacio vectorial subyacente. El rango de ${\ Displaystyle P_ {A}}$ es por tanto el espacio final de ${\ Displaystyle A}$ . También está claro que ${\ displaystyle AA ^ {\ mathrm {T}}}$ es el operador de identidad en ${\ Displaystyle U}$ .

La condición de ortonormalidad también se puede eliminar. Si ${\ Displaystyle \ mathbf {u} _ {1}, \ ldots, \ mathbf {u} _ {k}}$ es una base (no necesariamente ortonormal), y ${\ Displaystyle A}$ es la matriz con estos vectores como columnas, entonces la proyección es: ^[6]^[7]

{\ Displaystyle P_ {A} = A \ left (A ^ {\ mathrm {T}} A \ right) ^ {- 1} A ^ {\ mathrm {T}}.}

La matriz ${\ Displaystyle A}$ todavía incrusta ${\ Displaystyle U}$ en el espacio vectorial subyacente, pero ya no es una isometría en general. La matriz ${\ Displaystyle \ left (A ^ {\ mathrm {T}} A \ right) ^ {- 1}}$ es un "factor normalizador" que recupera la norma. Por ejemplo, el operador de rango 1 ${\ Displaystyle \ mathbf {u} \ mathbf {u} ^ {\ mathrm {T}}}$ no es una proyección si ${\ Displaystyle \ left \ | \ mathbf {u} \ right \ | \ neq 1.}$ Después de dividir por ${\ Displaystyle \ mathbf {u} ^ {\ mathrm {T}} \ mathbf {u} = \ left \ | \ mathbf {u} \ right \ | ^ {2},}$ obtenemos la proyección ${\ Displaystyle \ mathbf {u} \ left (\ mathbf {u} ^ {\ mathsf {T}} \ mathbf {u} \ right) ^ {- 1} \ mathbf {u} ^ {\ mathsf {T}} }$ en el subespacio abarcado por ${\ Displaystyle u}$ .

En el caso general, podemos tener una matriz definida positiva arbitraria ${\ Displaystyle D}$ definiendo un producto interior ${\ Displaystyle \ langle x, y \ rangle _ {D} = y ^ {\ dagger} Dx}$ , y la proyección ${\ Displaystyle P_ {A}}$ es dado por ${\ textstyle P_ {A} x = \ operatorname {argmin} _ {y \ in \ mathrm {rango} (A)} \ left \ | xy \ right \ | _ {D} ^ {2}}$ . Luego

{\ Displaystyle P_ {A} = A (A ^ {\ mathrm {T}} DA) ^ {- 1} A ^ {\ mathrm {T}} D.}

Cuando el espacio de rango de la proyección es generado por un marco (es decir, el número de generadores es mayor que su dimensión), la fórmula para la proyección toma la forma: ${\ Displaystyle P_ {A} = AA ^ {+}}$ . Aquí ${\ Displaystyle A ^ {+}}$ representa el pseudoinverso de Moore-Penrose . Esta es solo una de las muchas formas de construir el operador de proyección.

Si ${\ displaystyle {\ begin {bmatrix} A&B \ end {bmatrix}}}$ es una matriz no singular y ${\ Displaystyle A ^ {\ mathrm {T}} B = 0}$ (es decir, ${\ Displaystyle B}$ es la matriz de espacio nulo de ${\ Displaystyle A}$ ), ^[8] lo siguiente es válido:

{\ displaystyle {\ begin {alineado} I & = {\ begin {bmatrix} A&B \ end {bmatrix}} {\ begin {bmatrix} A&B \ end {bmatrix}} ^ {- 1} {\ begin {bmatrix} A ^ {\ mathrm {T}} \\ B ^ {\ mathrm {T}} \ end {bmatrix}} ^ {- 1} {\ begin {bmatrix} A ^ {\ mathrm {T}} \\ B ^ {\ mathrm {T}} \ end {bmatrix}} \\ & = {\ begin {bmatrix} A&B \ end {bmatrix}} \ left ({\ begin {bmatrix} A ^ {\ mathrm {T}} \\ B ^ {\ mathrm {T}} \ end {bmatrix}} {\ begin {bmatrix} A&B \ end {bmatrix}} \ right) ^ {- 1} {\ begin {bmatrix} A ^ {\ mathrm {T}} \ \ B ^ {\ mathrm {T}} \ end {bmatrix}} \\ & = {\ begin {bmatrix} A&B \ end {bmatrix}} {\ begin {bmatrix} A ^ {\ mathrm {T}} A&O \ \ O&B ^ {\ mathrm {T}} B \ end {bmatrix}} ^ {- 1} {\ begin {bmatrix} A ^ {\ mathrm {T}} \\ B ^ {\ mathrm {T}} \ end {bmatrix}} \\ [4pt] & = A (A ^ {\ mathrm {T}} A) ^ {- 1} A ^ {\ mathrm {T}} + B (B ^ {\ mathrm {T}} B) ^ {- 1} B ^ {\ mathrm {T}} \ end {alineado}}}

Si la condición ortogonal se mejora para ${\ Displaystyle A ^ {\ mathrm {T}} WB = A ^ {\ mathrm {T}} W ^ {\ mathrm {T}} B = 0}$ con ${\ Displaystyle W}$ no singular, se cumple lo siguiente:

{\ displaystyle I = {\ begin {bmatrix} A&B \ end {bmatrix}} {\ begin {bmatrix} \ left (A ^ {\ mathsf {T}} WA \ right) ^ {- 1} A ^ {\ mathrm {T}} \\\ izquierda (B ^ {\ mathsf {T}} WB \ right) ^ {- 1} B ^ {\ mathrm {T}} \ end {bmatrix}} W.}

Todas estas fórmulas también son válidas para espacios de productos internos complejos, siempre que se utilice la transposición conjugada en lugar de la transposición. Se pueden encontrar más detalles sobre las sumas de los proyectores en Banerjee y Roy (2014). ^[9] Ver también Banerjee (2004) ^[10] para la aplicación de sumas de proyectores en trigonometría esférica básica.

Proyecciones oblicuas

El término proyecciones oblicuas se utiliza a veces para referirse a proyecciones no ortogonales. Estas proyecciones también se utilizan para representar figuras espaciales en dibujos bidimensionales (ver proyección oblicua ), aunque no con tanta frecuencia como proyecciones ortogonales. Mientras que el cálculo del valor ajustado de una regresión de mínimos cuadrados ordinaria requiere una proyección ortogonal, el cálculo del valor ajustado de una regresión de variables instrumentales requiere una proyección oblicua.

Las proyecciones se definen por su espacio nulo y los vectores base utilizados para caracterizar su rango (que es el complemento del espacio nulo). Cuando estos vectores base son ortogonales al espacio nulo, entonces la proyección es una proyección ortogonal. Cuando estos vectores base no son ortogonales al espacio nulo, la proyección es una proyección oblicua. Deja que los vectores ${\ Displaystyle \ mathbf {u} _ {1}, \ ldots, \ mathbf {u} _ {k}}$ formar una base para el rango de la proyección, y ensamblar estos vectores en el ${\ Displaystyle n \ times k}$ matriz ${\ Displaystyle A}$ . El rango y el espacio nulo son espacios complementarios, por lo que el espacio nulo tiene dimensión ${\ Displaystyle nk}$ . De ello se deduce que el complemento ortogonal del espacio nulo tiene dimensión ${\ Displaystyle k}$ . Dejar ${\ Displaystyle \ mathbf {v} _ {1}, \ ldots, \ mathbf {v} _ {k}}$ formar una base para el complemento ortogonal del espacio nulo de la proyección, y ensamblar estos vectores en la matriz ${\ Displaystyle B}$ . Entonces la proyección se define por

{\ Displaystyle P = A \ left (B ^ {\ mathsf {T}} A \ right) ^ {- 1} B ^ {\ mathsf {T}}.}

Esta expresión generaliza la fórmula para proyecciones ortogonales dada anteriormente. ^[11]^[12]

Encontrar proyección con un producto interior

Dejar ${\ Displaystyle V}$ ser un espacio vectorial (en este caso un plano) atravesado por vectores ortogonales ${\ Displaystyle \ mathbf {u} _ {1}, \ mathbf {u} _ {2}, \ dots, \ mathbf {u} _ {p}}$ . Dejar ${\ Displaystyle y}$ ser un vector. Se puede definir una proyección de ${\ Displaystyle \ mathbf {y}}$ sobre ${\ Displaystyle V}$ como

{\ Displaystyle \ operatorname {proj} _ {V} \ mathbf {y} = {\ frac {\ mathbf {y} \ cdot \ mathbf {u} ^ {i}} {\ mathbf {u} ^ {i} \ cdot \ mathbf {u} ^ {i}}} \ mathbf {u} ^ {i}}

donde los índices repetidos se suman ( notación de suma de Einstein ). El vector ${\ Displaystyle \ mathbf {y}}$ puede escribirse como una suma ortogonal tal que ${\ Displaystyle \ mathbf {y} = \ operatorname {proj} _ {V} \ mathbf {y} + \ mathbf {z}}$ . ${\ Displaystyle \ operatorname {proj} _ {V} \ mathbf {y}}$ a veces se denota como ${\ Displaystyle {\ hat {\ mathbf {y}}}}$ . Hay un teorema en álgebra lineal que establece que este ${\ Displaystyle \ mathbf {z}}$ es la distancia más corta desde ${\ Displaystyle \ mathbf {y}}$ a ${\ Displaystyle V}$ y se usa comúnmente en áreas como el aprendizaje automático.

y se proyecta en el espacio vectorial V.

Formas canónicas

Cualquier proyección ${\ Displaystyle P = P ^ {2}}$ en un espacio vectorial de dimensión ${\ Displaystyle d}$ sobre un campo es una matriz diagonalizable , ya que su polinomio mínimo divide ${\ Displaystyle x ^ {2} -x}$ , que se divide en distintos factores lineales. Por tanto, existe una base en la que ${\ Displaystyle P}$ tiene la forma

{\ Displaystyle P = I_ {r} \ oplus 0_ {dr}}

dónde ${\ Displaystyle r}$ es el rango de ${\ Displaystyle P}$ . Aquí ${\ Displaystyle I_ {r}}$ es la matriz de identidad del tamaño ${\ Displaystyle r}$ , y ${\ displaystyle 0_ {dr}}$ es la matriz cero de tamaño ${\ displaystyle dr}$ . Si el espacio vectorial es complejo y está equipado con un producto interno , entonces existe una base ortonormal en la que la matriz de P es ^[13]

{\ displaystyle P = {\ begin {bmatrix} 1 & \ sigma _ {1} \\ 0 & 0 \ end {bmatrix}} \ oplus \ cdots \ oplus {\ begin {bmatrix} 1 & \ sigma _ {k} \\ 0 & 0 \ end {bmatrix}} \ oplus I_ {m} \ oplus 0_ {s}.}

dónde ${\ Displaystyle \ sigma _ {1} \ geq \ sigma _ {2} \ geq \ dots \ geq \ sigma _ {k}> 0}$ . Los enteros ${\ Displaystyle k, s, m}$ y los números reales ${\ Displaystyle \ sigma _ {i}}$ están determinados de forma única. Tenga en cuenta que ${\ Displaystyle 2k + s + m = d}$ . El factor ${\ Displaystyle I_ {m} \ oplus 0_ {s}}$ corresponde al subespacio invariante máximo en el que ${\ Displaystyle P}$ actúa como una proyección ortogonal (de modo que P en sí mismo es ortogonal si y sólo si ${\ Displaystyle k = 0}$ ) y el ${\ Displaystyle \ sigma _ {i}}$ -los bloques corresponden a los componentes oblicuos .

Proyecciones sobre espacios vectoriales normativos

Cuando el espacio vectorial subyacente ${\ Displaystyle X}$ es un espacio vectorial normado (no necesariamente de dimensión finita) , las cuestiones analíticas, irrelevantes en el caso de dimensión finita, deben ser consideradas. Asume ahora ${\ Displaystyle X}$ es un espacio de Banach .

Muchos de los resultados algebraicos discutidos anteriormente sobreviven al pasaje a este contexto. Una descomposición de suma directa dada de ${\ Displaystyle X}$ en subespacios complementarios todavía especifica una proyección, y viceversa. Si ${\ Displaystyle X}$ es la suma directa ${\ Displaystyle X = U \ oplus V}$ , entonces el operador definido por ${\ Displaystyle P (u + v) = u}$ sigue siendo una proyección con rango ${\ Displaystyle U}$ y kernel ${\ Displaystyle V}$ . También está claro que ${\ Displaystyle P ^ {2} = P}$ . Por el contrario, si ${\ Displaystyle P}$ es la proyección en ${\ Displaystyle X}$ , es decir ${\ Displaystyle P ^ {2} = P}$ , entonces se verifica fácilmente que ${\ Displaystyle (1-P) ^ {2} = (1-P)}$ . En otras palabras, ${\ Displaystyle 1-P}$ también es una proyección. La relación ${\ Displaystyle P ^ {2} = P}$ implica ${\ Displaystyle 1 = P + (1-P)}$ y ${\ Displaystyle X}$ es la suma directa ${\ Displaystyle \ operatorname {rg} (P) \ oplus \ operatorname {rg} (1-P)}$ .

Sin embargo, en contraste con el caso de dimensión finita, las proyecciones no necesitan ser continuas en general. Si un subespacio ${\ Displaystyle U}$ de ${\ Displaystyle X}$ no está cerrado en la topología de la norma, entonces la proyección sobre ${\ Displaystyle U}$ no es continuo. En otras palabras, el rango de una proyección continua ${\ Displaystyle P}$ debe ser un subespacio cerrado. Además, el núcleo de una proyección continua (de hecho, un operador lineal continuo en general) está cerrado. Así una proyección continua ${\ Displaystyle P}$ da una descomposición de ${\ Displaystyle X}$ en dos subespacios cerrados complementarios : ${\ Displaystyle X = \ operatorname {rg} (P) \ oplus \ ker (P) = \ ker (1-P) \ oplus \ ker (P)}$ .

Lo contrario también es válido, con una suposición adicional. Suponer ${\ Displaystyle U}$ es un subespacio cerrado de ${\ Displaystyle X}$ . Si existe un subespacio cerrado ${\ Displaystyle V}$ tal que X = U ⊕ V , entonces la proyección ${\ Displaystyle P}$ con rango ${\ Displaystyle U}$ y kernel ${\ Displaystyle V}$ es continuo. Esto se sigue del teorema del gráfico cerrado . Suponga que x _n → x y Px _n → y . Hay que demostrar que ${\ Displaystyle Px = y}$ . Desde ${\ Displaystyle U}$ está cerrado y { Px _n } ⊂ U , y se encuentra en ${\ Displaystyle U}$ , es decir, Py = y . Además, x _n - Px _n = ( I - P ) x _n → x - y . Porque ${\ Displaystyle V}$ está cerrado y {( I - P ) x _n } ⊂ V , tenemos ${\ Displaystyle xy \ in V}$ , es decir ${\ Displaystyle P (xy) = Px-Py = Px-y = 0}$ , lo que prueba la afirmación.

El argumento anterior hace uso del supuesto de que tanto ${\ Displaystyle U}$ y ${\ Displaystyle V}$ esta cerrado. En general, dado un subespacio cerrado ${\ Displaystyle U}$ , no es necesario que exista un subespacio cerrado complementario ${\ Displaystyle V}$ , aunque para los espacios de Hilbert esto siempre se puede hacer tomando el complemento ortogonal . Para los espacios de Banach, un subespacio unidimensional siempre tiene un subespacio complementario cerrado. Ésta es una consecuencia inmediata del teorema de Hahn-Banach . Dejar ${\ Displaystyle U}$ ser el tramo lineal de ${\ Displaystyle u}$ . Por Hahn-Banach, existe un funcional lineal acotado ${\ Displaystyle \ varphi}$ tal que φ ( u ) = 1 . El operador ${\ Displaystyle P (x) = \ varphi (x) u}$ satisface ${\ Displaystyle P ^ {2} = P}$ , es decir, es una proyección. Delimitación de ${\ Displaystyle \ varphi}$ implica continuidad de ${\ Displaystyle P}$ y por lo tanto ${\ Displaystyle \ ker (P) = \ operatorname {rg} (IP)}$ es un subespacio complementario cerrado de ${\ Displaystyle U}$ .

Aplicaciones y consideraciones adicionales

Las proyecciones (ortogonales y de otro tipo) juegan un papel importante en los algoritmos para ciertos problemas de álgebra lineal:

Descomposición QR (ver Transformación de amo de casa y Descomposición de Gram-Schmidt )
Valor singular de descomposición
Reducción a la forma de Hessenberg (el primer paso en muchos algoritmos de valores propios )
Regresión lineal
Los elementos proyectivos de las álgebras matriciales se utilizan en la construcción de ciertos grupos K en la teoría K del operador.

Como se dijo anteriormente, las proyecciones son un caso especial de idempotentes. Analíticamente, las proyecciones ortogonales son generalizaciones no conmutativas de funciones características . Los idempotentes se utilizan para clasificar, por ejemplo, álgebras semisimple , mientras que la teoría de la medida comienza con la consideración de funciones características de conjuntos medibles. Por lo tanto, como se puede imaginar, las proyecciones se encuentran muy a menudo en el contexto de álgebras de operadores . En particular, un álgebra de von Neumann se genera mediante su entramado completo de proyecciones.

Generalizaciones

De manera más general, dado un mapa entre espacios vectoriales normativos ${\ Displaystyle T \ dos puntos V \ a W,}$ análogamente se puede pedir que este mapa sea una isometría en el complemento ortogonal del núcleo: que ${\ Displaystyle (\ ker T) ^ {\ perp} \ to W}$ ser una isometría (compárese con la isometría parcial ); en particular, debe estar en. El caso de una proyección ortogonal es cuando W es un subespacio de V. En la geometría de Riemann , esto se usa en la definición de una inmersión de Riemann .

Ver también

Matriz de centrado , que es un ejemplo de matriz de proyección.
Ortogonalización
Subespacio invariante
Propiedades de la traza
El algoritmo de proyección de Dykstra para calcular la proyección en una intersección de conjuntos

Notas

^ Meyer, págs. 386 + 387
^ a b Horn, Roger A .; Johnson, Charles R. (2013). Matrix Analysis, segunda edición . Prensa de la Universidad de Cambridge. ISBN 9780521839402.
^ Meyer, pág. 433
^ Meyer, pág. 431
^ Meyer, ecuación (5.13.4)
^ Banerjee, Sudipto; Roy, Anindya (2014), Álgebra lineal y análisis de matrices para estadística , Textos en ciencia estadística (1a ed.), Chapman y Hall / CRC, ISBN 978-1420095388
^ Meyer, ecuación (5.13.3)
^ Ver también Mínimos cuadrados lineales (matemáticas) § Propiedades de los estimadores de mínimos cuadrados .
^ Banerjee, Sudipto; Roy, Anindya (2014), Álgebra lineal y análisis de matrices para estadística , Textos en ciencia estadística (1a ed.), Chapman y Hall / CRC, ISBN 978-1420095388
^ Banerjee, Sudipto (2004), "Revisitando la trigonometría esférica con proyectores ortogonales", The College Mathematics Journal , 35 (5): 375–381, doi : 10.1080 / 07468342.2004.11922099 , S2CID 122277398
^ Banerjee, Sudipto; Roy, Anindya (2014), Álgebra lineal y análisis de matrices para estadística , Textos en ciencia estadística (1a ed.), Chapman y Hall / CRC, ISBN 978-1420095388
↑ Meyer, ecuación (7.10.39)
^ Doković, D. Ž. (Agosto de 1991). "Similitud unitaria de proyectores". Aequationes Mathematicae . 42 (1): 220–224. doi : 10.1007 / BF01818492 . S2CID 122704926 .

Referencias

Banerjee, Sudipto; Roy, Anindya (2014), Álgebra lineal y análisis de matrices para estadística , Textos en ciencia estadística (1a ed.), Chapman y Hall / CRC, ISBN 978-1420095388
Dunford, N .; Schwartz, JT (1958). Operadores lineales, Parte I: Teoría general . Interscience.
Meyer, Carl D. (2000). Análisis de matrices y álgebra lineal aplicada . Sociedad de Matemáticas Industriales y Aplicadas. ISBN 978-0-89871-454-8.

enlaces externos

Conferencia de álgebra lineal del MIT sobre matrices de proyección en YouTube , de MIT OpenCourseWare
Álgebra lineal 15d: La transformación de la proyección en YouTube , por Pavel Grinfeld .
Tutorial de proyecciones geométricas planas: un tutorial sencillo de seguir que explica los diferentes tipos de proyecciones geométricas planas.

[1] Meyer, págs. 386 + 387

[HornJohnson-2] Horn, Roger A .; Johnson, Charles R. (2013). Matrix Analysis, segunda edición . Prensa de la Universidad de Cambridge. ISBN 9780521839402.

[3] Meyer, pág. 433

[4] Meyer, pág. 431

[5] Meyer, ecuación (5.13.4)

[6] Banerjee, Sudipto; Roy, Anindya (2014), Álgebra lineal y análisis de matrices para estadística , Textos en ciencia estadística (1a ed.), Chapman y Hall / CRC, ISBN 978-1420095388

[7] Meyer, ecuación (5.13.3)

[8] Ver también Mínimos cuadrados lineales (matemáticas) § Propiedades de los estimadores de mínimos cuadrados .

[9] Banerjee, Sudipto; Roy, Anindya (2014), Álgebra lineal y análisis de matrices para estadística , Textos en ciencia estadística (1a ed.), Chapman y Hall / CRC, ISBN 978-1420095388

[10] Banerjee, Sudipto (2004), "Revisitando la trigonometría esférica con proyectores ortogonales", The College Mathematics Journal , 35 (5): 375–381, doi : 10.1080 / 07468342.2004.11922099 , S2CID 122277398

[11] Banerjee, Sudipto; Roy, Anindya (2014), Álgebra lineal y análisis de matrices para estadística , Textos en ciencia estadística (1a ed.), Chapman y Hall / CRC, ISBN 978-1420095388

[12] Meyer, ecuación (7.10.39)

[13] Doković, D. Ž. (Agosto de 1991). "Similitud unitaria de proyectores". Aequationes Mathematicae . 42 (1): 220–224. doi : 10.1007 / BF01818492 . S2CID 122704926 .

[1]