Définition et exemples d'analyse de données secondaires

L'analyse des données secondaires est l'analyse des données collectées par quelqu'un d'autre. Ci-dessous, nous passerons en revue la définition des données secondaires, comment elles peuvent être utilisées par les chercheurs et les avantages et les inconvénients de ce type de recherche.

Points clés: analyse des données secondaires

Les données primaires se réfèrent aux données que les chercheurs ont elles-mêmes collectées, tandis que les données secondaires se réfèrent aux données qui ont été collectées par quelqu'un d'autre.
Les données secondaires sont disponibles auprès de diverses sources, telles que les gouvernements et les instituts de recherche.
Bien que l'utilisation de données secondaires puisse être plus économique, les ensembles de données existants peuvent ne pas répondre à toutes les questions d'un chercheur.

Comparaison des données primaires et secondaires

Dans la recherche en sciences sociales, les termes données primaires et données secondaires sont courants. Les données primaires sont collectées par un chercheur ou une équipe de chercheurs dans le but spécifique ou l'analyse considérée. Ici, une équipe de recherche conçoit et développe un projet de recherche, décide d'un

instagram viewer

technique d'échantillonnage, recueille des données conçues pour répondre à des questions spécifiques et effectue ses propres analyses des données collectées. Dans ce cas, les personnes impliquées dans l'analyse des données connaissent le processus de conception de la recherche et de collecte de données.

Analyse des données secondaires, d'autre part, est l'utilisation de données qui a été recueilli par quelqu'un d'autre à d'autres fins. Dans ce cas, le chercheur pose des questions qui sont traitées par l'analyse d'un ensemble de données qu'il n'a pas participé à la collecte. Les données n'ont pas été collectées pour répondre aux questions de recherche spécifiques du chercheur et ont plutôt été collectées dans un autre but. Cela signifie que le même ensemble de données peut en fait être un ensemble de données principal pour un chercheur et un ensemble de données secondaire pour un autre.

Utilisation de données secondaires

Il y a des choses importantes à faire avant d'utiliser des données secondaires dans une analyse. Étant donné que le chercheur n'a pas collecté les données, il est important pour lui de se familiariser avec l'ensemble de données: comment les données ont été collectées, quelles sont les catégories de réponses pour chaque la question de savoir si des pondérations doivent être appliquées ou non au cours de l'analyse, si des grappes ou une stratification doivent être prises en compte, qui était la population étudiée, et plus.

De nombreuses ressources et ensembles de données secondaires sont disponible pour la recherche sociologique, dont beaucoup sont publics et facilement accessibles. le Recensement des États-Unis, les Enquête sociale générale, et le Enquête sur la communauté américaine sont quelques-uns des ensembles de données secondaires les plus couramment disponibles.

Avantages de l'analyse des données secondaires

Le plus grand avantage de l'utilisation de données secondaires est qu'elles peuvent être plus économiques. Quelqu'un d'autre a déjà collecté les données, de sorte que le chercheur n'a pas à consacrer d'argent, de temps, d'énergie et de ressources à cette phase de la recherche. Parfois, le jeu de données secondaire doit être acheté, mais le coût est presque toujours inférieur aux frais de collecte d'un ensemble de données à partir de zéro, qui comprend généralement les salaires, les voyages et les transports, les bureaux, l'équipement et autres frais généraux frais. De plus, comme les données sont déjà collectées et généralement nettoyées et stockées sous format électronique, le chercheur peut passer la majeure partie de son temps analyser les données au lieu de préparer les données pour l'analyse.

Un deuxième avantage majeur de l'utilisation de données secondaires est l'étendue des données disponibles. Le gouvernement fédéral mène de nombreuses études à grande échelle nationale que les chercheurs auraient du mal à recueillir. Beaucoup de ces ensembles de données sont également longitudinal, ce qui signifie que les mêmes données ont été collectées auprès de la même population sur plusieurs périodes différentes. Cela permet aux chercheurs d'examiner les tendances et les changements de phénomènes au fil du temps.

Un troisième avantage important de l'utilisation de données secondaires est que le processus de collecte de données maintient souvent un niveau d'expertise et de professionnalisme qui peuvent ne pas être présents avec des chercheurs individuels ou de petits projets de recherche. Par exemple, la collecte de données pour de nombreux ensembles de données fédérales est souvent effectuée par des membres du personnel spécialisés dans certaines tâches et ont de nombreuses années d'expérience dans ce domaine particulier et avec cette enquête particulière. De nombreux petits projets de recherche n'ont pas ce niveau d'expertise, car de nombreuses données sont collectées par les étudiants travaillant à temps partiel.

Inconvénients de l'analyse des données secondaires

Un inconvénient majeur de l’utilisation de données secondaires est qu’elles peuvent ne pas répondre aux questions de recherche spécifiques du chercheur ou contenir des informations spécifiques que le chercheur souhaiterait avoir. Elle peut également ne pas avoir été collectée dans la région géographique ou pendant les années souhaitées, ou auprès de la population spécifique que le chercheur souhaite étudier. Par exemple, un chercheur qui souhaite étudier les adolescents peut constater que l'ensemble de données secondaires ne comprend que les jeunes adultes.

De plus, puisque le chercheur n'a pas collecté les données, il n'a aucun contrôle sur ce qui est contenu dans l'ensemble de données. Souvent, cela peut limiter l'analyse ou modifier les questions originales auxquelles le chercheur a cherché à répondre. Par exemple, un chercheur qui étudie le bonheur et l'optimisme pourrait découvrir qu'un ensemble de données secondaires ne comprend qu'un seul de ces éléments. les variables, mais pas les deux.

Un problème connexe est que les variables peuvent avoir été définis ou classés différemment que le chercheur aurait choisi. Par exemple, l'âge peut avoir été collecté dans des catégories plutôt que comme une variable continue, ou la race peut être définie comme «blanche» et «autre» au lieu de contenir des catégories pour chaque race principale.

Un autre inconvénient important de l'utilisation de données secondaires est que le chercheur ne sait pas exactement comment le processus de collecte de données a été effectué ou comment il a été mené à bien. Le chercheur n'est généralement pas au courant des informations sur la gravité des données affectées par des problèmes tels que le faible taux de réponse ou la mauvaise compréhension par les répondants de questions spécifiques de l'enquête. Parfois, cette information est facilement accessible, comme c'est le cas avec de nombreux ensembles de données fédérales. Cependant, de nombreux autres ensembles de données secondaires ne sont pas accompagnés de ce type d'informations et l'analyste doit apprendre à lire entre les lignes afin de découvrir toute limitation potentielle des données.