En álgebra lineal y análisis funcional , una proyección es una transformación lineal de un espacio vectorial a sí mismo de modo que. Es decir, siempre quese aplica dos veces a cualquier valor, da el mismo resultado que si se aplicara una vez ( idempotente ). Deja su imagen sin cambios. [1] Aunque abstracta , esta definición de "proyección" formaliza y generaliza la idea de proyección gráfica . También se puede considerar el efecto de una proyección en un objeto geométrico examinando el efecto de la proyección en puntos del objeto.
Definiciones
Una proyección en un espacio vectorial. es un operador lineal tal que .
Cuándo tiene un producto interno y está completo (es decir, cuandoes un espacio de Hilbert ) se puede utilizar el concepto de ortogonalidad . Una proyección en un espacio de Hilbert se llama proyección ortogonal si satisface para todos . Una proyección en un espacio de Hilbert que no es ortogonal se llama proyección oblicua .
Matriz de proyección
- En el caso de dimensión finita, una matriz cuadrada se llama matriz de proyección si es igual a su cuadrado, es decir, si. [2] : pág. 38
- Una matriz cuadrada se llama matriz de proyección ortogonal si para una matriz real, y respectivamente para una matriz compleja, donde denota la transposición de y denota la transposición adjunta o hermitiana de. [2] : pág. 223
- Una matriz de proyección que no es una matriz de proyección ortogonal se denomina matriz de proyección oblicua .
Los valores propios de una matriz de proyección deben ser 0 o 1.
Ejemplos de
Proyección ortogonal
Por ejemplo, la función que mapea el punto en el espacio tridimensional al punto es una proyección ortogonal sobre el plano xy . Esta función está representada por la matriz
La acción de esta matriz sobre un vector arbitrario es
Para ver eso es de hecho una proyección, es decir, , calculamos
- .
Observando eso muestra que la proyección es una proyección ortogonal.
Proyección oblicua
Un ejemplo simple de una proyección no ortogonal (oblicua) (para la definición, ver más abajo) es
A través de la multiplicación de matrices , uno ve que
demostrando que es de hecho una proyección.
La proyección es ortogonal si y solo si porque solo entonces .
Propiedades y clasificación
Idempotencia
Por definición, una proyección es idempotente (es decir).
Complementariedad de rango y kernel
Dejar ser un espacio vectorial de dimensión finita y ser una proyección en . Supongamos que los subespacios y son el rango y el núcleo derespectivamente. Luego tiene las siguientes propiedades:
- es el operador de identidad en
- .
- Tenemos una suma directa . Cada vector puede descomponerse únicamente como con y , y donde .
El rango y el núcleo de una proyección son complementarios , al igual que y . El operador es también una proyección como el rango y el núcleo de convertirse en el núcleo y la gama de y viceversa. Decimos es una proyección a lo largo de sobre (kernel / rango) y es una proyección a lo largo de sobre .
Espectro
En espacios vectoriales de dimensión infinita, el espectro de una proyección está contenido en como
Solo 0 o 1 pueden ser un valor propio de una proyección. Esto implica que una proyección ortogonales siempre una matriz semidefinida positiva. En general, los espacios propios correspondientes son (respectivamente) el núcleo y el rango de la proyección. La descomposición de un espacio vectorial en sumas directas no es única. Por lo tanto, dado un subespacio, puede haber muchas proyecciones cuyo rango (o kernel) sea .
Si una proyección no es trivial, tiene un polinomio mínimo. , que influye en raíces distintas, y por lo tanto es diagonalizable .
Producto de proyecciones
El producto de las proyecciones no es en general una proyección, incluso si son ortogonales. Si dos proyecciones se conmutan, entonces su producto es una proyección, pero lo contrario es falso: el producto de dos proyecciones que no conmutan puede ser una proyección.
Si dos proyecciones ortogonales se conmutan, su producto es una proyección ortogonal. Si el producto de dos proyecciones ortogonales es una proyección ortogonal, entonces las dos proyecciones ortogonales conmutan (más generalmente: dos endomorfismos autoadjuntos conmutan si y solo si su producto es autoadjunto).
Proyecciones ortogonales
Cuando el espacio vectorial tiene un producto interno y es completo (es un espacio de Hilbert ) se puede utilizar el concepto de ortogonalidad . Una proyección ortogonal es una proyección para la cual el rango y el espacio nulo son subespacios ortogonales . Por lo tanto, para cada y en , . Equivalentemente:
Una proyección es ortogonal si y solo si es autoadjunta . Usando las propiedades autoadjuntas e idempotentes de, para cualquier y en tenemos , , y
dónde es el producto interno asociado con. Por lo tanto, y son proyecciones ortogonales. [3] La otra dirección, a saber, que si es ortogonal entonces es autoadjunto, se sigue de
para cada y en ; por lo tanto.
Prueba de existencia Dejar ser un espacio métrico completo con un producto interno , y dejarser un subespacio lineal cerrado de (y, por tanto, también completo).
Para cada el siguiente conjunto de valores normativos no negativostiene un mínimo , y debido a la integridad dees un mínimo . Definimos como el punto en donde se obtiene este mínimo.
Obviamente es en . Queda por demostrar que satisface y que es lineal.
Definamos . Por cada distinto de cero en , lo siguiente es válido:
Definiendo vemos eso a no ser que desaparece. Desde fue elegido como el mínimo del conjunto mencionado, de lo que se deduce que de hecho desaparece. En particular, (para): .
La linealidad se sigue de la desaparición de para cada :
Al tomar la diferencia entre las ecuaciones tenemos
Pero ya que podemos elegir (como está en sí mismo en ) resulta que . Similarmente tenemospor cada escalar .
Propiedades y casos especiales
Una proyección ortogonal es un operador acotado . Esto se debe a que para cadaen el espacio vectorial tenemos, por desigualdad de Cauchy-Schwarz :
Por lo tanto .
Para espacios vectoriales complejos o reales de dimensión finita, el producto interno estándar puede ser sustituido por.
Fórmulas
Un caso simple ocurre cuando la proyección ortogonal está sobre una línea. Sies un vector unitario en la línea, entonces la proyección viene dada por el producto externo
(Si tiene un valor complejo, la transpuesta en la ecuación anterior se reemplaza por una transpuesta hermitiana). Este operador deja u invariante y aniquila todos los vectores ortogonales a, lo que demuestra que de hecho es la proyección ortogonal sobre la línea que contiene u . [4] Una forma sencilla de ver esto es considerar un vector arbitrario como la suma de un componente en la línea (es decir, el vector proyectado que buscamos) y otro perpendicular a él, . Aplicando proyección, obtenemos
por las propiedades del producto escalar de vectores paralelos y perpendiculares.
Esta fórmula se puede generalizar a proyecciones ortogonales en un subespacio de dimensión arbitraria. Dejarser una base ortonormal del subespacio, y deja denotar el matriz cuyas columnas son , es decir . Entonces la proyección viene dada por: [5]
que se puede reescribir como
La matriz es la isometría parcial que desaparece en el complemento ortogonal de y es la isometría que incrusta en el espacio vectorial subyacente. El rango dees por tanto el espacio final de. También está claro que es el operador de identidad en .
La condición de ortonormalidad también se puede eliminar. Si es una base (no necesariamente ortonormal), y es la matriz con estos vectores como columnas, entonces la proyección es: [6] [7]
La matriz todavía incrusta en el espacio vectorial subyacente, pero ya no es una isometría en general. La matrizes un "factor normalizador" que recupera la norma. Por ejemplo, el operador de rango 1 no es una proyección si Después de dividir por obtenemos la proyección en el subespacio abarcado por .
En el caso general, podemos tener una matriz definida positiva arbitraria definiendo un producto interior , y la proyección es dado por . Luego
Cuando el espacio de rango de la proyección es generado por un marco (es decir, el número de generadores es mayor que su dimensión), la fórmula para la proyección toma la forma:. Aquírepresenta el pseudoinverso de Moore-Penrose . Esta es solo una de las muchas formas de construir el operador de proyección.
Si es una matriz no singular y (es decir, es la matriz de espacio nulo de), [8] lo siguiente es válido:
Si la condición ortogonal se mejora para con no singular, se cumple lo siguiente:
Todas estas fórmulas también son válidas para espacios de productos internos complejos, siempre que se utilice la transposición conjugada en lugar de la transposición. Se pueden encontrar más detalles sobre las sumas de los proyectores en Banerjee y Roy (2014). [9] Ver también Banerjee (2004) [10] para la aplicación de sumas de proyectores en trigonometría esférica básica.
Proyecciones oblicuas
El término proyecciones oblicuas se utiliza a veces para referirse a proyecciones no ortogonales. Estas proyecciones también se utilizan para representar figuras espaciales en dibujos bidimensionales (ver proyección oblicua ), aunque no con tanta frecuencia como proyecciones ortogonales. Mientras que el cálculo del valor ajustado de una regresión de mínimos cuadrados ordinaria requiere una proyección ortogonal, el cálculo del valor ajustado de una regresión de variables instrumentales requiere una proyección oblicua.
Las proyecciones se definen por su espacio nulo y los vectores base utilizados para caracterizar su rango (que es el complemento del espacio nulo). Cuando estos vectores base son ortogonales al espacio nulo, entonces la proyección es una proyección ortogonal. Cuando estos vectores base no son ortogonales al espacio nulo, la proyección es una proyección oblicua. Deja que los vectores formar una base para el rango de la proyección, y ensamblar estos vectores en el matriz . El rango y el espacio nulo son espacios complementarios, por lo que el espacio nulo tiene dimensión. De ello se deduce que el complemento ortogonal del espacio nulo tiene dimensión. Dejar formar una base para el complemento ortogonal del espacio nulo de la proyección, y ensamblar estos vectores en la matriz . Entonces la proyección se define por
Esta expresión generaliza la fórmula para proyecciones ortogonales dada anteriormente. [11] [12]
Encontrar proyección con un producto interior
Dejar ser un espacio vectorial (en este caso un plano) atravesado por vectores ortogonales . Dejarser un vector. Se puede definir una proyección de sobre como
donde los índices repetidos se suman ( notación de suma de Einstein ). El vector puede escribirse como una suma ortogonal tal que . a veces se denota como . Hay un teorema en álgebra lineal que establece que este es la distancia más corta desde a y se usa comúnmente en áreas como el aprendizaje automático.
Formas canónicas
Cualquier proyección en un espacio vectorial de dimensión sobre un campo es una matriz diagonalizable , ya que su polinomio mínimo divide, que se divide en distintos factores lineales. Por tanto, existe una base en la que tiene la forma
dónde es el rango de . Aquí es la matriz de identidad del tamaño , y es la matriz cero de tamaño . Si el espacio vectorial es complejo y está equipado con un producto interno , entonces existe una base ortonormal en la que la matriz de P es [13]
dónde . Los enteros y los números reales están determinados de forma única. Tenga en cuenta que. El factor corresponde al subespacio invariante máximo en el que actúa como una proyección ortogonal (de modo que P en sí mismo es ortogonal si y sólo si) y el -los bloques corresponden a los componentes oblicuos .
Proyecciones sobre espacios vectoriales normativos
Cuando el espacio vectorial subyacente es un espacio vectorial normado (no necesariamente de dimensión finita) , las cuestiones analíticas, irrelevantes en el caso de dimensión finita, deben ser consideradas. Asume ahoraes un espacio de Banach .
Muchos de los resultados algebraicos discutidos anteriormente sobreviven al pasaje a este contexto. Una descomposición de suma directa dada deen subespacios complementarios todavía especifica una proyección, y viceversa. Si es la suma directa , entonces el operador definido por sigue siendo una proyección con rango y kernel . También está claro que. Por el contrario, si es la proyección en , es decir , entonces se verifica fácilmente que . En otras palabras,también es una proyección. La relación implica y es la suma directa .
Sin embargo, en contraste con el caso de dimensión finita, las proyecciones no necesitan ser continuas en general. Si un subespacio de no está cerrado en la topología de la norma, entonces la proyección sobre no es continuo. En otras palabras, el rango de una proyección continuadebe ser un subespacio cerrado. Además, el núcleo de una proyección continua (de hecho, un operador lineal continuo en general) está cerrado. Así una proyección continua da una descomposición de en dos subespacios cerrados complementarios :.
Lo contrario también es válido, con una suposición adicional. Suponer es un subespacio cerrado de . Si existe un subespacio cerradotal que X = U ⊕ V , entonces la proyección con rango y kernel es continuo. Esto se sigue del teorema del gráfico cerrado . Suponga que x n → x y Px n → y . Hay que demostrar que. Desdeestá cerrado y { Px n } ⊂ U , y se encuentra en, es decir, Py = y . Además, x n - Px n = ( I - P ) x n → x - y . Porqueestá cerrado y {( I - P ) x n } ⊂ V , tenemos, es decir , lo que prueba la afirmación.
El argumento anterior hace uso del supuesto de que tanto y esta cerrado. En general, dado un subespacio cerrado, no es necesario que exista un subespacio cerrado complementario , aunque para los espacios de Hilbert esto siempre se puede hacer tomando el complemento ortogonal . Para los espacios de Banach, un subespacio unidimensional siempre tiene un subespacio complementario cerrado. Ésta es una consecuencia inmediata del teorema de Hahn-Banach . Dejar ser el tramo lineal de . Por Hahn-Banach, existe un funcional lineal acotadotal que φ ( u ) = 1 . El operador satisface , es decir, es una proyección. Delimitación de implica continuidad de y por lo tanto es un subespacio complementario cerrado de .
Aplicaciones y consideraciones adicionales
Las proyecciones (ortogonales y de otro tipo) juegan un papel importante en los algoritmos para ciertos problemas de álgebra lineal:
- Descomposición QR (ver Transformación de amo de casa y Descomposición de Gram-Schmidt )
- Valor singular de descomposición
- Reducción a la forma de Hessenberg (el primer paso en muchos algoritmos de valores propios )
- Regresión lineal
- Los elementos proyectivos de las álgebras matriciales se utilizan en la construcción de ciertos grupos K en la teoría K del operador.
Como se dijo anteriormente, las proyecciones son un caso especial de idempotentes. Analíticamente, las proyecciones ortogonales son generalizaciones no conmutativas de funciones características . Los idempotentes se utilizan para clasificar, por ejemplo, álgebras semisimple , mientras que la teoría de la medida comienza con la consideración de funciones características de conjuntos medibles. Por lo tanto, como se puede imaginar, las proyecciones se encuentran muy a menudo en el contexto de álgebras de operadores . En particular, un álgebra de von Neumann se genera mediante su entramado completo de proyecciones.
Generalizaciones
De manera más general, dado un mapa entre espacios vectoriales normativos análogamente se puede pedir que este mapa sea una isometría en el complemento ortogonal del núcleo: que ser una isometría (compárese con la isometría parcial ); en particular, debe estar en. El caso de una proyección ortogonal es cuando W es un subespacio de V. En la geometría de Riemann , esto se usa en la definición de una inmersión de Riemann .
Ver también
- Matriz de centrado , que es un ejemplo de matriz de proyección.
- Ortogonalización
- Subespacio invariante
- Propiedades de la traza
- El algoritmo de proyección de Dykstra para calcular la proyección en una intersección de conjuntos
Notas
- ^ Meyer, págs. 386 + 387
- ^ a b Horn, Roger A .; Johnson, Charles R. (2013). Matrix Analysis, segunda edición . Prensa de la Universidad de Cambridge. ISBN 9780521839402.
- ^ Meyer, pág. 433
- ^ Meyer, pág. 431
- ^ Meyer, ecuación (5.13.4)
- ^ Banerjee, Sudipto; Roy, Anindya (2014), Álgebra lineal y análisis de matrices para estadística , Textos en ciencia estadística (1a ed.), Chapman y Hall / CRC, ISBN 978-1420095388
- ^ Meyer, ecuación (5.13.3)
- ^ Ver también Mínimos cuadrados lineales (matemáticas) § Propiedades de los estimadores de mínimos cuadrados .
- ^ Banerjee, Sudipto; Roy, Anindya (2014), Álgebra lineal y análisis de matrices para estadística , Textos en ciencia estadística (1a ed.), Chapman y Hall / CRC, ISBN 978-1420095388
- ^ Banerjee, Sudipto (2004), "Revisitando la trigonometría esférica con proyectores ortogonales", The College Mathematics Journal , 35 (5): 375–381, doi : 10.1080 / 07468342.2004.11922099 , S2CID 122277398
- ^ Banerjee, Sudipto; Roy, Anindya (2014), Álgebra lineal y análisis de matrices para estadística , Textos en ciencia estadística (1a ed.), Chapman y Hall / CRC, ISBN 978-1420095388
- ↑ Meyer, ecuación (7.10.39)
- ^ Doković, D. Ž. (Agosto de 1991). "Similitud unitaria de proyectores". Aequationes Mathematicae . 42 (1): 220–224. doi : 10.1007 / BF01818492 . S2CID 122704926 .
Referencias
- Banerjee, Sudipto; Roy, Anindya (2014), Álgebra lineal y análisis de matrices para estadística , Textos en ciencia estadística (1a ed.), Chapman y Hall / CRC, ISBN 978-1420095388
- Dunford, N .; Schwartz, JT (1958). Operadores lineales, Parte I: Teoría general . Interscience.
- Meyer, Carl D. (2000). Análisis de matrices y álgebra lineal aplicada . Sociedad de Matemáticas Industriales y Aplicadas. ISBN 978-0-89871-454-8.
enlaces externos
- Conferencia de álgebra lineal del MIT sobre matrices de proyección en YouTube , de MIT OpenCourseWare
- Álgebra lineal 15d: La transformación de la proyección en YouTube , por Pavel Grinfeld .
- Tutorial de proyecciones geométricas planas: un tutorial sencillo de seguir que explica los diferentes tipos de proyecciones geométricas planas.