L'une des nombreuses façons dont les variables statistiques peut être classé est de considérer les différences entre les variables explicatives et de réponse. Bien que ces variables soient liées, il existe d'importantes distinctions entre elles. Après avoir défini ces types de variables, nous verrons que l'identification correcte de ces variables a une influence directe sur d'autres aspects des statistiques, comme la construction d'un nuage de points et la pente d'une droite de régression.
Définitions de l'explication et de la réponse
Nous commençons par examiner les définitions de ces types de variables. Une variable de réponse est une quantité particulière sur laquelle nous posons une question dans notre étude. Une variable explicative est tout facteur qui peut influencer la variable de réponse. Bien qu'il puisse exister de nombreuses variables explicatives, nous nous intéresserons principalement à une seule variable explicative.
Une variable de réponse peut ne pas être présente dans une étude. La dénomination de ce type de variable dépend des questions posées par un chercheur. La réalisation d'une étude observationnelle serait un exemple de cas où il n'y a pas de variable de réponse. Une expérience aura une variable de réponse. La conception minutieuse d'une expérience tente d'établir que les changements dans une variable de réponse sont directement causés par des changements dans les variables explicatives.
Exemple un
Pour explorer ces concepts, nous examinerons quelques exemples. Pour le premier exemple, supposons qu'un chercheur souhaite étudier l'humeur et les attitudes d'un groupe d'étudiants de première année. Tous les étudiants de première année reçoivent une série de questions. Ces questions sont conçues pour évaluer le degré de mal du pays d'un élève. Les élèves indiquent également dans l'enquête à quelle distance leur collège est loin de chez eux.
Un chercheur qui examine ces données pourrait simplement être intéressé par les types de réponses des étudiants. La raison en est peut-être d'avoir une idée globale de la composition d'un nouvel étudiant de première année. Dans ce cas, il n'y a pas de variable de réponse. C'est parce que personne ne voit si la valeur d'une variable influence la valeur d'une autre.
Un autre chercheur pourrait utiliser les mêmes données pour tenter de répondre si les étudiants qui venaient de plus loin avaient un plus grand mal du pays. Dans ce cas, les données relatives aux questions sur le mal du pays sont les valeurs d'une variable de réponse, et les données qui indiquent la distance du domicile constituent la variable explicative.
Exemple deux
Pour le deuxième exemple, nous pourrions être curieux de savoir si le nombre d'heures passées à faire des devoirs a un effet sur la note qu'un élève gagne à un examen. Dans ce cas, parce que nous montrons que la valeur d'une variable change la valeur d'une autre, il y a une variable explicative et une variable de réponse. Le nombre d'heures étudiées est la variable explicative et le score au test est la variable de réponse.
Nuages de points et variables
Quand nous travaillons avec données quantitatives appariées, il convient d'utiliser un nuage de points. Le but de ce type de graphique est de montrer les relations et les tendances au sein des données appariées. Nous n'avons pas besoin d'avoir à la fois une variable explicative et une variable de réponse. Si tel est le cas, alors l'une ou l'autre variable peut être tracée le long de l'un ou l'autre axe. Cependant, en cas de réponse et de variable explicative, la variable explicative est toujours tracée le long de la X ou axe horizontal d'un système de coordonnées cartésiennes. La variable de réponse est ensuite tracée le long de la y axe.
Indépendant et dépendant
La distinction entre les variables explicatives et les réponses est similaire à une autre classification. Parfois, nous appelons les variables indépendant ou dépendant. La valeur d'un variable dépendante repose sur celle d'un variable indépendante. Ainsi, une variable de réponse correspond à une variable dépendante tandis qu'une variable explicative correspond à une variable indépendante. Cette terminologie n'est généralement pas utilisée dans les statistiques car la variable explicative n'est pas vraiment indépendante. Au lieu de cela, la variable prend uniquement les valeurs observées. Nous pouvons n'avoir aucun contrôle sur les valeurs d'une variable explicative.