En matemáticas y estadística multivariante , la matriz de centrado [1] es una matriz simétrica e idempotente , que cuando se multiplica con un vector tiene el mismo efecto que restar la media de los componentes del vector de cada componente de ese vector.
Definición
La matriz de centrado de tamaño n se define como la matriz n- por- n
dónde es la matriz identidad de tamaño n yes una matriz n por n de todos unos .
Por ejemplo
- ,
- ,
Propiedades
Dado un vector columna, de tamaño n , la propiedad de centrado de se puede expresar como
dónde es un vector de columna de unos y es la media de los componentes de .
es simétrico positivo semidefinido .
es idempotente , por lo que, por . Una vez que se ha eliminado la media, es cero y eliminarla de nuevo no tiene ningún efecto.
es singular . Los efectos de aplicar la transformación no se puede revertir.
tiene el valor propio 1 de multiplicidad n - 1 y el valor propio 0 de multiplicidad 1.
tiene un espacio nulo de dimensión 1, a lo largo del vector.
es una matriz de proyección ortogonal . Es decir, es una proyección de en el subespacio ( n - 1) -dimensional que es ortogonal al espacio nulo. (Este es el subespacio de todos los n -vectores cuyos componentes suman cero).
El rastro de es .
Solicitud
Aunque la multiplicación por la matriz de centrado no es una forma computacionalmente eficiente de eliminar la media de un vector, es una herramienta analítica conveniente. Puede usarse no solo para eliminar la media de un solo vector, sino también de múltiples vectores almacenados en las filas o columnas de una matriz m- por- n.
La multiplicación de la izquierda por resta un valor medio correspondiente de cada una de las n columnas, de modo que cada columna del productotiene una media cero. Del mismo modo, la multiplicación pora la derecha resta un valor medio correspondiente de cada una de las m filas, y cada fila del productotiene una media cero. La multiplicación en ambos lados crea una matriz doblemente centrada, cuyas medias de fila y columna son iguales a cero.
La matriz de centrado proporciona, en particular, una forma sucinta de expresar la matriz de dispersión , de una muestra de datos , dónde es la media muestral . La matriz de centrado nos permite expresar la matriz de dispersión de forma más compacta como
es la matriz de covarianza de la distribución multinomial , en el caso especial donde los parámetros de esa distribución son, y .