El análisis multilineal de componentes principales ( MPCA ) es una extensión multilineal del análisis de componentes principales (PCA). MPCA se emplea en el análisis de matrices de n vías, es decir, un cubo o hipercubo de números, también denominado informalmente "tensor de datos". Las matrices de N vías pueden descomponerse, analizarse o modelarse mediante
- modelos de tensor lineal como CANDECOMP / Parafac, o
- modelos de tensor multilineal, como el análisis multilineal de componentes principales (MPCA) o el análisis multilineal de componentes independientes (MICA), etc.
El origen de MPCA se remonta a la descomposición de Tucker [1] y al trabajo de Peter Kroonenberg "M-mode PCA / 3-mode PCA". [2] En 2000, De Lathauwer et al. reformuló el trabajo de Tucker y Kroonenberg en términos computacionales numéricos claros y concisos en su artículo SIAM titulado " Descomposición de valores singulares multilineales ", [3] (HOSVD) y en su artículo "On the Best Rank-1 and Rank- (R 1 , R 2 , ..., R N ) Aproximación de tensores de orden superior ". [4]
Alrededor de 2001, Vasilescu reformuló los problemas de análisis, reconocimiento y síntesis de datos como problemas de tensor multilineal basándose en la idea de que la mayoría de los datos observados son la consecuencia compositiva de varios factores causales de la formación de datos y son muy adecuados para el análisis de tensor de datos multimodal. El poder del marco tensorial se demostró mediante el análisis de los ángulos articulares del movimiento humano, las imágenes faciales o las texturas en términos de sus factores causales de formación de datos en los siguientes trabajos: Human Motion Signatures [5] (CVPR 2001, ICPR 2002), reconocimiento facial - TensorFaces , [6] [7] (ECCV 2002, CVPR 2003, etc.) y gráficos por computadora - TensorTexture [8] (Siggraph 2004).
Históricamente, la MPCA se ha denominado "PCA en modo M", una terminología que fue acuñada por Peter Kroonenberg en 1980. [2] En 2005, Vasilescu y Terzopoulos introdujeron la terminología PCA multilineal [9] como una forma de diferenciar mejor entre Descomposición de tensor lineal y multilineal, así como para diferenciar mejor entre el trabajo [5] [6] [7] [8] que calculó estadísticas de segundo orden asociadas con cada modo de tensor de datos (eje), y el trabajo posterior en Componente independiente multilineal Análisis [9] que calculó estadísticas de orden superior asociadas con cada modo / eje tensorial.
El PCA multilineal se puede aplicar para calcular los factores causales de la formación de datos, o como herramienta de procesamiento de señales en tensores de datos cuyas observaciones individuales han sido vectorizadas, [5] [6] [7] [8] o cuyas observaciones se tratan como matrices [ 10] y concatenados en un tensor de datos.
MPCA calcula un conjunto de matrices ortonormales asociadas con cada modo del tensor de datos que son análogas al espacio ortonormal de filas y columnas de una matriz calculada por la matriz SVD. Esta transformación tiene como objetivo capturar una varianza tan alta como sea posible, teniendo en cuenta la mayor parte de la variabilidad en los datos asociados con cada modo de tensor de datos (eje).
El algoritmo
La solución MPCA sigue el enfoque de mínimos cuadrados alternos (ALS). [2] Es de naturaleza iterativa. Como en PCA, MPCA trabaja con datos centrados. El centrado es un poco más complicado para los tensores y depende del problema.
Selección de características
Funciones MPCA: La selección de funciones MPCA supervisada se utiliza en el reconocimiento de objetos [11] mientras que la selección de funciones MPCA no supervisada se emplea en la tarea de visualización. [12]
Extensiones
Se han desarrollado varias extensiones de MPCA: [13]
- MPCA no correlacionado (UMPCA) [14] En contraste, el MPCA no correlacionado (UMPCA) genera características multilineales no correlacionadas. [14]
- Impulso + MPCA [15]
- MPCA no negativo (NMPCA) [16]
- MPCA robusto (RMPCA) [17]
- Factorización multitensor, que también encuentra el número de componentes automáticamente (MTF) [18]
Referencias
- ^ Tucker, Ledyard R (septiembre de 1966). "Algunas notas matemáticas sobre el análisis factorial de tres modos". Psychometrika . 31 (3): 279–311. doi : 10.1007 / BF02289464 . PMID 5221127 .
- ^ a b c P. M. Kroonenberg y J. de Leeuw, Análisis de componentes principales de datos de tres modos mediante algoritmos de mínimos cuadrados alternos , Psychometrika, 45 (1980), págs. 69–97.
- ^ Lathauwer, LD; Moor, BD; Vandewalle, J. (2000). "Una descomposición de valor singular multilineal" . Revista SIAM sobre Análisis y Aplicaciones Matriciales . 21 (4): 1253-1278. doi : 10.1137 / s0895479896305696 .
- ^ Lathauwer, LD; Moor, BD; Vandewalle, J. (2000). "Sobre la mejor aproximación de rango-1 y rango- (R1, R2, ..., RN) de tensores de orden superior" . Revista SIAM sobre Análisis y Aplicaciones Matriciales . 21 (4): 1324-1342. doi : 10.1137 / s0895479898346995 .
- ^ a b c M.AO Vasilescu (2002) "Firmas de movimiento humano: análisis, síntesis, reconocimiento", Actas de la Conferencia internacional sobre reconocimiento de patrones (ICPR 2002), vol. 3, Ciudad de Quebec, Canadá, agosto de 2002, 456–460.
- ^ a b c M.AO Vasilescu, D. Terzopoulos (2002) "Análisis multilineal de conjuntos de imágenes: TensorFaces", Proc. 7th European Conference on Computer Vision (ECCV'02), Copenhague, Dinamarca, mayo de 2002, en Computer Vision - ECCV 2002, Lecture Notes in Computer Science, vol. 2350, A. Heyden y col. (Eds.), Springer-Verlag, Berlín, 2002, 447–460.
- ^ a b c M.AO Vasilescu, D. Terzopoulos (2003) "Análisis subespacial multilineal para conjuntos de imágenes, MAO Vasilescu, D. Terzopoulos, Proc. Visión por computadora y reconocimiento de patrones Conf. (CVPR '03), Vol.2, Madison , WI, junio de 2003, 93–99.
- ^ a b c M.AO Vasilescu, D. Terzopoulos (2004) "TensorTexture: Representación multilineal basada en imágenes", MAO Vasilescu y D. Terzopoulos, Proc. ACM SIGGRAPH 2004 Conference Los Ángeles, CA, agosto de 2004, en Computer Graphics Proceedings, Annual Conference Series, 2004, 336–342.
- ^ a b M. AO Vasilescu, D. Terzopoulos (2005) "Análisis de componentes independientes multilineales" , "Actas de la Conferencia IEEE sobre visión por computadora y reconocimiento de patrones (CVPR'05), San Diego, CA, junio de 2005, vol.1 , 547–553 ".
- ^ Lu, H .; Plataniotis, KN; Venetsanopoulos, AN (2008). "MPCA: análisis multilineal de componentes principales de objetos tensoriales" (PDF) . IEEE Trans. Neural Netw . 19 (1): 18–39. CiteSeerX 10.1.1.331.5543 . doi : 10.1109 / tnn.2007.901277 . PMID 18269936 .
- ^ MAO Vasilescu, D. Terzopoulos (2003) "Análisis subespacial multilineal de conjuntos de imágenes" , "Actas de la Conferencia IEEE sobre visión por computadora y reconocimiento de patrones (CVPR'03), Madison, WI, junio de 2003"
- ^ H. Lu, H.-L. Eng, M. Thida y KN Plataniotis, " Visualization and Clustering of Crowd Video Content in MPCA Subspace ", en Actas de la XIX Conferencia ACM sobre Gestión de la Información y el Conocimiento (CIKM 2010), Toronto, ON, Canadá, octubre de 2010.
- ^ Lu, Haiping; Plataniotis, KN; Venetsanopoulos, AN (2011). "Una encuesta de aprendizaje subespacial multilineal para datos tensoriales" (PDF) . Reconocimiento de patrones . 44 (7): 1540-1551. doi : 10.1016 / j.patcog.2011.01.004 .
- ^ a b H. Lu, KN Plataniotis y AN Venetsanopoulos, " Análisis de componentes principales multilineales no correlacionados para el aprendizaje subespacial multilineal no supervisado ", IEEE Trans. Neural Netw., Vol. 20, no. 11, págs. 1820–1836, noviembre de 2009.
- ^ H. Lu, KN Plataniotis y AN Venetsanopoulos, "Impulsar a los estudiantes discriminantes para el reconocimiento de la marcha utilizando características MPCA archivado el22 de octubre de 2010en la Wayback Machine ", EURASIP Journal on Image and Video Processing, Volumen 2009, ID de artículo 713183, 11 páginas , 2009. doi : 10.1155 / 2009/713183 .
- ^ Y. Panagakis, C. Kotropoulos, GR Arce, "Análisis de componente principal multilineal no negativo de modulaciones temporales auditivas para clasificación de género musical", IEEE Trans. sobre procesamiento de audio, habla y lenguaje, vol. 18, no. 3, págs. 576–588, 2010.
- ^ K. Inoue, K. Hara, K. Urahama, "Análisis robusto de componentes principales multilineales", Proc. Conferencia IEEE sobre visión por computadora, 2009, págs. 591–597.
- ^ Khan, Suleiman A .; Leppäaho, Eemeli; Kaski, Samuel (10 de junio de 2016). "Factorización multitensorial bayesiana". Aprendizaje automático . 105 (2): 233-253. arXiv : 1412.4679 . doi : 10.1007 / s10994-016-5563-y . ISSN 0885-6125 .
enlaces externos
- Código de Matlab : MPCA .
- Código de Matlab : UMPCA (incluidos los datos) .
- Código R: MTF