La gamme d'ensembles de données statistiques

En statistique et en mathématiques, la plage est la différence entre les valeurs maximale et minimale d'un ensemble de données et constitue l'une des deux caractéristiques importantes d'un ensemble de données. La formule d'une plage est la valeur maximale moins la valeur minimale dans l'ensemble de données, ce qui permet aux statisticiens de mieux comprendre la variation de l'ensemble de données.

Deux caractéristiques importantes d'un ensemble de données comprennent le centre des données et la répartition des données, et le centre peut êtremesurée de plusieurs façons: les plus populaires sont la moyenne, médian, mode et milieu de gamme, mais d'une manière similaire, il existe différentes façons de calculer la répartition de l'ensemble de données et la mesure de propagation la plus simple et la plus grossière est appelée la plage.

Le calcul de la plage est très simple. Tout ce que nous devons faire est de trouver la différence entre la plus grande valeur de données de notre ensemble et la plus petite valeur de données. En résumé, nous avons la formule suivante: Plage = Valeur maximale – Valeur minimale. Par exemple, l'ensemble de données 4, 6, 10, 15, 18 a un maximum de 18, un minimum de 4 et une plage de

instagram viewer
18-4 = 14.

La plage est une mesure très grossière de la diffusion des données car elle est extrêmement sensible aux valeurs aberrantes et, par conséquent, il existe certaines limitations à l'utilité d'une véritable gamme d'un ensemble de données pour les statisticiens, car une seule valeur de données peut affecter considérablement la valeur de la intervalle.

Par exemple, considérons l'ensemble des données 1, 2, 3, 4, 6, 7, 7, 8. La valeur maximale est 8, la valeur minimale est 1 et la plage est 7. Considérez ensuite le même ensemble de données, uniquement avec la valeur 100 incluse. La gamme devient maintenant 100-1 = 99 où l'ajout d'un seul point de données supplémentaire a grandement affecté la valeur de la plage. L'écart type est une autre mesure de l'écart qui est moins sensible aux valeurs aberrantes, mais l'inconvénient est que le calcul de l'écart type est beaucoup plus compliqué.

La gamme ne nous dit également rien sur les caractéristiques internes de notre ensemble de données. Par exemple, nous considérons l'ensemble de données 1, 1, 2, 3, 4, 5, 5, 6, 7, 8, 8, 10 où la plage de cet ensemble de données est 10-1 = 9. Si nous comparons ensuite cela à l'ensemble de données de 1, 1, 1, 2, 9, 9, 9, 10. Ici, la plage est, encore une fois, de neuf pour ce deuxième ensemble et contrairement au premier ensemble, les données sont regroupées autour du minimum et du maximum. D'autres statistiques, telles que le premier et le troisième quartile, devraient être utilisées pour détecter une partie de cette structure interne.

La plage est un bon moyen d'avoir une compréhension très basique de la répartition réelle des nombres dans l'ensemble de données, car il est facile de calculer car il ne nécessite qu'une opération arithmétique de base, mais il existe également quelques autres applications de la plage d'un ensemble de données dans statistiques.

La plage peut également être utilisée pour estimer une autre mesure de l'écart, l'écart type. Plutôt que de passer par une formule assez compliquée pour trouver l'écart-type, nous pouvons plutôt utiliser ce qu'on appelle le règle de plage. La plage est fondamentale dans ce calcul.

La plage se produit également dans un boxplot, ou boîte et moustaches tracer. Les valeurs maximale et minimale sont toutes deux représentées à la fin des moustaches du graphique et la longueur totale des moustaches et de la boîte est égale à la plage.

instagram story viewer