Que sont les résidus?

click fraud protection

La régression linéaire est un outil statistique qui détermine dans quelle mesure une ligne droite s'adapte à un ensemble de données appariées. La ligne droite qui correspond le mieux à ces données est appelée la ligne de régression des moindres carrés. Cette ligne peut être utilisée de plusieurs façons. L'une de ces utilisations consiste à estimer la valeur d'une variable de réponse pour une valeur donnée d'une variable explicative. Liée à cette idée est celle d'un résidu.

(1, 2), (2, 3), (3, 7), (3, 6), (4, 9), (5, 9)

Pour calculer le résidu aux points X = 5, nous soustrayons la valeur prédite de notre valeur observée. Depuis le y la coordonnée de notre point de données était de 9, ce qui donne un résidu de 9 - 10 = -1.

Il existe plusieurs utilisations pour les résidus. Une utilisation est de nous aider à déterminer si nous avons un ensemble de données qui a une tendance linéaire globale, ou si nous devrions envisager un modèle différent. La raison en est que les résidus aident à amplifier tout motif non linéaire dans nos données. Ce qui peut être difficile à voir en regardant un nuage de points peut être plus facilement observé en examinant les résidus et un tracé résiduel correspondant.

instagram viewer

Une autre raison de considérer les résidus est de vérifier que les conditions d'inférence pour la régression linéaire sont remplies. Après vérification d'une tendance linéaire (en vérifiant les résidus), nous vérifions également la distribution des résidus. Afin de pouvoir effectuer l'inférence de régression, nous voulons que les résidus sur notre droite de régression soient distribués approximativement normalement. UNE histogramme ou stemplot des résidus permettra de vérifier que cette condition est remplie.

instagram story viewer