Les premier et troisième quartiles sont des statistiques descriptives qui sont des mesures de position dans un ensemble de données. Semblable à la façon dont la médiane désigne le point médian d'un ensemble de données, le premier quartile marque le quart ou 25%. Environ 25% des valeurs des données sont inférieures ou égales au premier quartile. Le troisième quartile est similaire, mais pour les 25% supérieurs des valeurs de données. Nous examinerons ces idées plus en détail dans ce qui suit.
La médiane
Il existe plusieurs façons de mesurer centre d'un ensemble de données. La moyenne, la médiane, le mode et le milieu de gamme ont tous leurs avantages et leurs limites à exprimer le milieu des données. De toutes ces façons de trouver la moyenne, le médian est le plus résistant aux valeurs aberrantes. Il marque le milieu des données dans le sens où la moitié des données est inférieure à la médiane.
Le premier quartile
Il n'y a aucune raison pour que nous nous arrêtions à trouver juste le milieu. Et si nous décidions de poursuivre ce processus? Nous avons pu calculer la médiane de la moitié inférieure de nos données. Une moitié de 50% est de 25%. Ainsi, la moitié de la moitié, ou le quart, des données seraient inférieures à cette valeur. Étant donné que nous avons affaire au quart de l'ensemble d'origine, cette médiane de la moitié inférieure des données est appelée le premier quartile et est notée par
Q1.Le troisième quartile
Il n'y a aucune raison pour laquelle nous avons examiné la moitié inférieure des données. Au lieu de cela, nous aurions pu regarder la moitié supérieure et effectuer les mêmes étapes que ci-dessus. La médiane de cette moitié, que nous désignerons par Q3 divise également l'ensemble de données en trimestres. Cependant, ce nombre représente le quart supérieur des données. Ainsi, les trois quarts des données sont inférieures à notre nombre Q3. C’est pourquoi nous appelons Q3 le troisième quartile.
Un exemple
Pour que tout soit clair, regardons un exemple. Il peut être utile d'examiner d'abord comment calculer la médiane de certaines données. Commencez avec l'ensemble de données suivant:
1, 2, 2, 3, 4, 6, 6, 7, 7, 7, 8, 11, 12, 15, 15, 15, 17, 17, 18, 20
Il y a un total de vingt points de données dans l'ensemble. Nous commençons par trouver la médiane. Puisqu'il existe un nombre pair de valeurs de données, la médiane est la moyenne des dixième et onzième valeurs. En d'autres termes, la médiane est:
(7 + 8)/2 = 7.5.
Regardez maintenant la moitié inférieure des données. La médiane de cette moitié se situe entre les cinquième et sixième valeurs de:
1, 2, 2, 3, 4, 6, 6, 7, 7, 7
Ainsi, le premier quartile est égal à Q1 = (4 + 6)/2 = 5
Pour trouver le troisième quartile, regardez la moitié supérieure de l'ensemble de données d'origine. Nous devons trouver la médiane de:
8, 11, 12, 15, 15, 15, 17, 17, 18, 20
Ici, la médiane est (15 + 15) / 2 = 15. Ainsi, le troisième quartile Q3 = 15.
Intervalle interquartile et résumé des cinq nombres
Les quartiles aident à nous donner une image plus complète de notre ensemble de données dans son ensemble. Les premier et troisième quartiles nous renseignent sur la structure interne de nos données. La moitié médiane des données se situe entre les premier et troisième quartiles et est centrée sur la médiane. La différence entre les premier et troisième quartiles, appelée gamme interquartile, montre comment les données sont organisées sur la médiane. Une petite plage interquartile indique des données regroupées autour de la médiane. Une plage interquartile plus large montre que les données sont plus étalées.
Une image plus détaillée des données peut être obtenue en connaissant la valeur la plus élevée, appelée valeur maximale, et la valeur la plus basse, appelée valeur minimale. Le minimum, le premier quartile, la médiane, le troisième quartile et le maximum sont un ensemble de cinq valeurs appelées résumé de cinq chiffres. Un moyen efficace d'afficher ces cinq nombres est appelé boxplot ou box and whisker graph.