Análisis multilineal de componentes principales

El análisis multilineal de componentes principales ( MPCA ) es una extensión multilineal del análisis de componentes principales (PCA). MPCA se emplea en el análisis de matrices de n vías, es decir, un cubo o hipercubo de números, también denominado informalmente "tensor de datos". Las matrices de N vías pueden descomponerse, analizarse o modelarse mediante

El origen de MPCA se remonta a la descomposición de Tucker ^[1] y al trabajo de Peter Kroonenberg "M-mode PCA / 3-mode PCA". ^[2] En 2000, De Lathauwer et al. reformuló el trabajo de Tucker y Kroonenberg en términos computacionales numéricos claros y concisos en su artículo SIAM titulado " Descomposición de valores singulares multilineales ", ^[3] (HOSVD) y en su artículo "On the Best Rank-1 and Rank- (R ₁ , R ₂ , ..., R _N ) Aproximación de tensores de orden superior ". ^[4]

Alrededor de 2001, Vasilescu reformuló los problemas de análisis, reconocimiento y síntesis de datos como problemas de tensor multilineal basándose en la idea de que la mayoría de los datos observados son la consecuencia compositiva de varios factores causales de la formación de datos y son muy adecuados para el análisis de tensor de datos multimodal. El poder del marco tensorial se demostró mediante el análisis de ángulos articulares de movimiento humano, imágenes faciales o texturas en términos de sus factores causales de formación de datos en los siguientes trabajos: Human Motion Signatures ^[5] (CVPR 2001, ICPR 2002), reconocimiento facial - TensorFaces , ^[6]^[7] (ECCV 2002, CVPR 2003, etc.) y gráficos por computadora - TensorTexture ^[8] (Siggraph 2004).

Históricamente, la MPCA se ha denominado "PCA en modo M", una terminología que fue acuñada por Peter Kroonenberg en 1980. ^[2] En 2005, Vasilescu y Terzopoulos introdujeron la terminología PCA multilineal ^[9] como una forma de diferenciar mejor entre Descomposición de tensor lineal y multilineal, así como para diferenciar mejor entre el trabajo ^[5]^[6]^[7]^[8] que calculó estadísticas de segundo orden asociadas con cada modo de tensor de datos (eje), y el trabajo posterior en Componente independiente multilineal Análisis ^[9] que calculó estadísticas de orden superior asociadas con cada modo / eje tensorial.

El PCA multilineal se puede aplicar para calcular los factores causales de la formación de datos, o como herramienta de procesamiento de señales en tensores de datos cuyas observaciones individuales han sido vectorizadas, ^[5]^[6]^[7]^[8] o cuyas observaciones se tratan como matrices ^{[ 10]} y concatenados en un tensor de datos.

MPCA calcula un conjunto de matrices ortonormales asociadas con cada modo del tensor de datos que son análogas al espacio ortonormal de filas y columnas de una matriz calculada por la matriz SVD. Esta transformación tiene como objetivo capturar una varianza tan alta como sea posible, teniendo en cuenta la mayor parte de la variabilidad en los datos asociados con cada modo de tensor de datos (eje).