Qu'est-ce que la règle de l'intervalle interquartile?

La règle de l'intervalle interquartile est utile pour détecter la présence de valeurs aberrantes. Valeurs aberrantes sont des valeurs individuelles qui ne relèvent pas du modèle global d'un ensemble de données. Cette définition est quelque peu vague et subjective, il est donc utile d'avoir une règle à appliquer lorsque déterminer si un point de données est vraiment une valeur aberrante - c'est là que la règle de la plage interquartile entre.

Tout ensemble de données peut être décrit par son résumé à cinq chiffres. Ces cinq chiffres, qui vous donnent les informations dont vous avez besoin pour trouver des modèles et des valeurs aberrantes, sont constitués (par ordre croissant):

Ces cinq chiffres en disent plus à une personne sur ses données que de les consulter simultanément, ou du moins de faciliter la tâche. Par exemple, le intervalle, qui est le minimum soustrait du maximum, est un indicateur de la répartition des données dans un ensemble (remarque: la plage est très sensible aux valeurs aberrantes - si une valeur aberrante est également un minimum ou un maximum, la plage ne sera pas une représentation précise de l'étendue d'une donnée ensemble).

instagram viewer

Sinon, il serait difficile d'extrapoler. La plage interquartile est similaire à la fourchette mais moins sensible aux valeurs aberrantes. le gamme interquartile est calculé de la même manière que la plage. Tout ce que vous faites pour le trouver, c'est soustraire le premier quartile du troisième quartile:

L'intervalle interquartile montre comment les données sont réparties sur la médiane. Il est moins sensible que la gamme aux valeurs aberrantes et peut donc être plus utile.

Bien qu'il ne soit pas souvent affecté par eux, la plage interquartile peut être utilisée pour détecter les valeurs aberrantes. Cela se fait en utilisant ces étapes:

N'oubliez pas que la règle interquartile n'est qu'une règle générale qui s'applique généralement mais ne s'applique pas à tous les cas. En général, vous devez toujours suivre votre analyse des valeurs aberrantes en étudiant les valeurs aberrantes résultantes pour voir si elles ont un sens. Toute valeur aberrante potentielle obtenue par la méthode interquartile doit être examinée dans le contexte de l'ensemble des données.

Voir la règle de l'intervalle interquartile à l'œuvre avec un exemple. Supposons que vous disposiez de l'ensemble de données suivant: 1, 3, 4, 6, 7, 7, 8, 8, 10, 12, 17. Le résumé à cinq chiffres pour cet ensemble de données est minimum = 1, premier quartile = 4, médiane = 7, troisième quartile = 10 et maximum = 17. Vous pouvez regarder les données et dire automatiquement que 17 est une valeur aberrante, mais que dit la règle de l'intervalle interquartile?

Multipliez maintenant votre réponse par 1,5 pour obtenir 1,5 x 6 = 9. Neuf de moins que le premier quartile est 4 - 9 = -5. Aucune donnée n'est inférieure à cela. Neuf de plus que le troisième quartile est 10 + 9 = 19. Aucune donnée n'est supérieure à cela. Bien que la valeur maximale soit cinq de plus que le point de données le plus proche, la règle de l'intervalle interquartile montre qu'elle ne devrait probablement pas être considérée comme une valeur aberrante pour cet ensemble de données.