Comment utiliser l'analyse de grappes dans la recherche en sciences sociales

click fraud protection

L'analyse en grappes est une technique statistique utilisée pour identifier comment diverses unités - comme les personnes, les groupes ou les sociétés - peuvent être regroupées en raison des caractéristiques qu'elles ont en commun. Également connu sous le nom de clustering, il s'agit d'un outil d'analyse de données exploratoire qui vise à trier différents objets en groupes de telle manière que lorsqu'ils appartiennent au même groupe, ils ont un degré d'association maximal et lorsqu'ils n'appartiennent pas au même groupe, leur degré d'association est minimal. Contrairement à certains autres techniques de statistique, les structures découvertes par l'analyse de grappes n'ont besoin d'aucune explication ou interprétation - elles découvrent la structure dans les données sans expliquer pourquoi elles existent.

Qu'est-ce que le clustering?

Le regroupement existe dans presque tous les aspects de notre vie quotidienne. Prenez, par exemple, des articles dans une épicerie. Différents types d'articles sont toujours affichés au même endroit ou à proximité - viande, légumes, soda, céréales, produits en papier, etc. Les chercheurs veulent souvent faire de même avec les données et regrouper les objets ou les sujets en grappes qui ont du sens.

instagram viewer

Pour prendre un exemple des sciences sociales, disons que nous examinons les pays et voulons les regrouper en grappes en fonction de caractéristiques telles que répartition du travail, militaires, technologie ou population instruite. Nous constaterions que la Grande-Bretagne, le Japon, la France, l'Allemagne et les États-Unis ont des caractéristiques similaires et seraient regroupés. L'Ouganda, le Nicaragua et le Pakistan seraient également regroupés dans un cluster différent car ils partagent un ensemble différent de caractéristiques, notamment de faibles niveaux de richesse, des divisions du travail plus simples, des institutions politiques relativement instables et non démocratiques et des développement.

L'analyse en grappes est généralement utilisée dans la phase exploratoire de la recherche lorsque le chercheur n'a aucune hypothèses préconçues. Ce n'est généralement pas la seule méthode statistique utilisée, mais elle est plutôt effectuée dans les premiers stades d'un projet pour guider le reste de l'analyse. Pour cette raison, les tests de signification ne sont généralement ni pertinents ni appropriés.

Il existe plusieurs types différents d'analyse de grappes. Les deux plus couramment utilisés sont le clustering K-means et le clustering hiérarchique.

Clustering K-means

Le regroupement K-means traite les observations dans les données comme des objets ayant des emplacements et des distances les uns des autres (notez que les distances utilisées dans le regroupement ne représentent souvent pas des distances spatiales). Il partitionne les objets en K clusters mutuellement exclusifs afin que les objets de chaque cluster soient aussi aussi proches les uns des autres que possible et en même temps, aussi loin que possible des objets d'autres grappes. Chaque cluster est alors caractérisé par son point moyen ou central.

Classification hiérarchique

Le regroupement hiérarchique est un moyen d'étudier les regroupements dans les données simultanément sur une variété d'échelles et de distances. Pour ce faire, il crée une arborescence de grappes à différents niveaux. Contrairement au clustering K-means, l'arborescence n'est pas un ensemble unique de clusters. Au contraire, l'arborescence est une hiérarchie à plusieurs niveaux où les clusters à un niveau sont joints en tant que clusters au niveau supérieur suivant. L'algorithme utilisé commence avec chaque cas ou variable dans un cluster séparé, puis combine les clusters jusqu'à ce qu'il n'en reste qu'un. Cela permet au chercheur de décider quel niveau de regroupement est le plus approprié pour sa recherche.

Exécution d'une analyse de cluster

Plus logiciels de statistiques peut effectuer une analyse de cluster. Dans SPSS, sélectionnez analyser dans le menu, puis classer et l'analyse par grappes. En SAS, le cluster proc peut être utilisée.

Mis à jour par Nicki Lisa Cole, Ph. D.

instagram story viewer