Composantes principales et analyse factorielle

L'analyse en composantes principales (ACP) et l'analyse factorielle (AF) sont des techniques statistiques utilisées pour la réduction des données ou la détection de structure. Ces deux méthodes sont appliquées à un seul ensemble de variables lorsque le chercheur souhaite découvrir quelles variables de l'ensemble forment des sous-ensembles cohérents qui sont relativement indépendants d'un un autre. Les variables qui sont corrélées entre elles mais qui sont largement indépendantes des autres ensembles de variables sont combinées en facteurs. Ces facteurs vous permettent de condenser le nombre de variables dans votre analyse en combinant plusieurs variables en un seul facteur.

Les objectifs spécifiques de l'APC ou de l'AF sont de résumer les schémas de corrélations parmi les variables observées, réduire un grand nombre de variables observées à un plus petit nombre de facteurs, fournir un équation de régression pour un processus sous-jacent en utilisant des variables observées, ou pour tester une théorie sur la nature des processus sous-jacents.

instagram viewer

Exemple

Supposons, par exemple, qu'un chercheur souhaite étudier les caractéristiques des étudiants diplômés. Le chercheur interroge un large échantillon d'étudiants diplômés sur les caractéristiques de la personnalité telles que motivation, capacité intellectuelle, histoire scolaire, histoire familiale, santé, caractéristiques physiques, etc. Chacun de ces domaines est mesuré avec plusieurs variables. Les variables sont ensuite saisies individuellement dans l'analyse et les corrélations entre elles sont étudiées. L'analyse révèle des modèles de corrélation entre les variables qui sont censées refléter les processus sous-jacents affectant les comportements des étudiants diplômés. Par exemple, plusieurs variables des mesures de la capacité intellectuelle se combinent avec certaines variables des mesures de l'histoire scolaire pour former un facteur mesurant l'intelligence. De même, les variables des mesures de la personnalité peuvent se combiner avec certaines variables de la motivation et de la scolarité mesures d'histoire pour former un facteur mesurant le degré auquel un étudiant préfère travailler de façon indépendante - une indépendance facteur.

Étapes de l'analyse des composants principaux et de l'analyse factorielle

Les étapes de l'analyse des principaux composants et de l'analyse factorielle comprennent:

  • Sélectionnez et mesurez un ensemble de variables.
  • Préparez la matrice de corrélation pour effectuer PCA ou FA.
  • Extraire un ensemble de facteurs de la matrice de corrélation.
  • Déterminez le nombre de facteurs.
  • Si nécessaire, faites pivoter les facteurs pour augmenter l'interprétabilité.
  • Interprétez les résultats.
  • Vérifiez la structure des facteurs en établissant la validité de construction des facteurs.

Différence entre l'analyse des composants principaux et l'analyse factorielle

L'analyse en composantes principales et l'analyse factorielle sont similaires car les deux procédures sont utilisées pour simplifier la structure d'un ensemble de variables. Cependant, les analyses diffèrent de plusieurs manières importantes:

  • Dans l'ACP, les composants sont calculés sous forme de combinaisons linéaires des variables d'origine. Dans FA, les variables d'origine sont définies comme des combinaisons linéaires des facteurs.
  • En PCA, l'objectif est de représenter autant de variance dans les variables que possible. L'objectif dans FA est d'expliquer les covariances ou corrélations entre les variables.
  • PCA est utilisé pour réduire les données en un plus petit nombre de composants. FA est utilisé pour comprendre quelles constructions sous-tendent les données.

Problèmes avec l'analyse des composants principaux et l'analyse factorielle

Un problème avec PCA et FA est qu'il n'y a pas de variable de critère par rapport à laquelle tester la solution. Dans d'autres techniques statistiques telles que l'analyse de fonction discriminante, la régression logistique, l'analyse de profil et multivariée analyse de variance, la solution est jugée sur la façon dont elle prédit l'appartenance à un groupe. Dans PCA et FA, il n'y a pas de critère externe tel que l'appartenance à un groupe par rapport auquel tester la solution.

Le deuxième problème de PCA et FA est qu'après l'extraction, il existe un nombre infini de rotations disponibles, tous représentant la même quantité de variance dans les données originales, mais avec un facteur défini légèrement différent. Le choix final est laissé au chercheur en fonction de son évaluation de son interprétabilité et de son utilité scientifique. Les chercheurs divergent souvent d'opinion sur le meilleur choix.

Un troisième problème est que l'AF est fréquemment utilisée pour «sauver» une recherche mal conçue. Si aucune autre procédure statistique n'est appropriée ou applicable, les données peuvent au moins être analysées par facteur. Cela laisse beaucoup à penser que les diverses formes d'AF sont associées à une recherche bâclée.

instagram story viewer