La prueba de Kaiser-Meyer-Olkin (KMO) es una medida estadística para determinar qué tan adecuados son los datos para el análisis factorial . La prueba mide la adecuación del muestreo para cada variable en el modelo y el modelo completo. La estadística es una medida de la proporción de varianza entre variables que podrían ser varianza común. Cuanto menor sea la proporción, más adecuados serán los datos para el análisis factorial. [1]
Henry Kaiser introdujo una Medida de adecuación muestral (MSA) de matrices de datos analíticos de factores en 1970. [2] Kaiser y Rice luego la modificaron en 1974. [3]
La medida de adecuación del muestreo se calcula para cada indicador como
e indica en qué medida un indicador es adecuado para un análisis factorial.
Aquí está la correlación entre la variable en cuestión y otra, y es la correlación parcial.
Esta es una función de los elementos cuadrados de la matriz de "imagen" en comparación con los cuadrados de las correlaciones originales. Se encuentran el MSA general, así como las estimaciones para cada elemento. El índice se conoce como índice de Kaiser-Meyer-Olkin (KMO). [4]
De manera extravagante, Kaiser propuso que un KMO> .9 era maravilloso, en los .80, meritorio, en los .70, mediocre, en los .60, mediocre, en los 50, miserable y menos de .5 sería inaceptable. . [3] En general, los valores de KMO entre 0,8 y 1 indican que el muestreo es adecuado. Los valores de KMO inferiores a 0,6 indican que el muestreo no es adecuado y que se deben tomar medidas correctivas. Por el contrario, otros establecen este valor de corte en 0,5. [5] Un valor de KMO cercano a cero significa que hay grandes correlaciones parciales en comparación con la suma de correlaciones. En otras palabras, existen correlaciones generalizadas que serían un gran problema para el análisis factorial. [1]
Una medida alternativa de si una matriz es factorizable es la prueba de Bartlett , que prueba el grado en que la matriz se desvía de una matriz de identidad . [1]
Si se ejecuta lo siguiente en R con la biblioteca (REdaS)
Se produce lo siguiente.
Esto muestra que los datos no son adecuados para el análisis factorial. [6]