Componentes principales y análisis factorial

El análisis de componentes principales (PCA) y el análisis factorial (FA) son técnicas estadísticas utilizadas para la reducción de datos o la detección de estructuras. Estos dos métodos se aplican a un solo conjunto de variables cuando el investigador está interesado en descubrir qué variables en el conjunto forman subconjuntos coherentes que son relativamente independientes de uno otro. Las variables que están correlacionadas entre sí pero que son en gran medida independientes de otros conjuntos de variables se combinan en factores. Estos factores le permiten condensar la cantidad de variables en su análisis combinando varias variables en un solo factor.

Los objetivos específicos de PCA o FA son resumir patrones de correlaciones entre las variables observadas, para reducir un gran número de variables observadas a un número menor de factores, para proporcionar un ecuación de regresión para un proceso subyacente utilizando variables observadas, o para probar una teoría sobre la naturaleza de los procesos subyacentes.

instagram viewer

Ejemplo

Digamos, por ejemplo, que un investigador está interesado en estudiar las características de los estudiantes graduados. El investigador encuesta a una gran muestra de estudiantes de posgrado sobre características de personalidad como motivación, capacidad intelectual, historia escolar, historia familiar, salud, características físicas, etc. Cada una de estas áreas se mide con varias variables. Las variables se ingresan en el análisis individualmente y se estudian las correlaciones entre ellas. El análisis revela patrones de correlación entre las variables que se cree que reflejan los procesos subyacentes que afectan los comportamientos de los estudiantes graduados. Por ejemplo, varias variables de las medidas de capacidad intelectual se combinan con algunas variables de las medidas de historia escolar para formar un factor que mide la inteligencia. Del mismo modo, las variables de las medidas de personalidad pueden combinarse con algunas variables de la motivación y la escolaridad. la historia mide para formar un factor que mide el grado en que un estudiante prefiere trabajar de forma independiente: una independencia factor.

Pasos del análisis de componentes principales y análisis factorial

Los pasos en el análisis de componentes principales y el análisis factorial incluyen:

  • Seleccione y mida un conjunto de variables.
  • Prepare la matriz de correlación para realizar PCA o FA.
  • Extraer un conjunto de factores de la matriz de correlación.
  • Determina el número de factores.
  • Si es necesario, gire los factores para aumentar la capacidad de interpretación.
  • Interpreta los resultados.
  • Verifique la estructura de factores estableciendo la validez de constructo de los factores.

Diferencia entre análisis de componentes principales y análisis factorial

El análisis de componentes principales y el análisis factorial son similares porque ambos procedimientos se utilizan para simplificar la estructura de un conjunto de variables. Sin embargo, los análisis difieren de varias maneras importantes:

  • En PCA, los componentes se calculan como combinaciones lineales de las variables originales. En FA, las variables originales se definen como combinaciones lineales de los factores.
  • En PCA, el objetivo es dar cuenta de la mayor parte del total diferencia en las variables como sea posible. El objetivo en FA es explicar las covarianzas o correlaciones entre las variables.
  • PCA se utiliza para reducir los datos en un número menor de componentes. FA se utiliza para comprender qué construcciones subyacen a los datos.

Problemas con el análisis de componentes principales y el análisis factorial

Un problema con PCA y FA es que no existe una variable de criterio para evaluar la solución. En otras técnicas estadísticas como el análisis de función discriminante, regresión logística, análisis de perfil y multivariante. Análisis de variación, la solución se juzga por lo bien que predice la pertenencia al grupo. En PCA y FA, ​​no existe un criterio externo, como la pertenencia a un grupo con el que probar la solución.

El segundo problema de PCA y FA es que, después de la extracción, hay un número infinito de rotaciones disponibles, todos representan la misma cantidad de variación en los datos originales, pero con el factor ligeramente definido diferente. La elección final se deja al investigador en función de su evaluación de su interpretabilidad y utilidad científica. Los investigadores a menudo difieren en la opinión sobre qué opción es la mejor.

Un tercer problema es que la FA se usa con frecuencia para "salvar" investigaciones mal concebidas. Si ningún otro procedimiento estadístico es apropiado o aplicable, los datos pueden al menos ser analizados por factores. Esto deja a muchos creer que las diversas formas de FA están asociadas con la investigación descuidada.

instagram story viewer