Les boxplots tirent leur nom de ce à quoi ils ressemblent. Ils sont parfois appelés parcelles en boîte et moustaches. Ces types de graphiques sont utilisés pour afficher la plage, médianet quartiles. Une fois terminées, une boîte contient le premier et troisième quartiles. Les moustaches s'étendent de la boîte aux valeurs minimales et maximales des données.
Les pages suivantes montreront comment créer un diagramme à boîte pour un ensemble de données avec au minimum 20, premier quartile 25, médiane 32, troisième quartile 35 et maximum 43.
Tracez cinq lignes verticales au-dessus de la ligne numérique, une pour chacune des valeurs du minimum, premier quartile, médiane, troisième quartile et maximum. En règle générale, les lignes pour le minimum et le maximum sont plus courtes que les lignes pour les quartiles et la médiane.
Pour nos données, le minimum est de 20, le premier quartile est de 25, la médiane est de 32, le troisième quartile de 35 et le maximum de 43. Les lignes correspondant à ces valeurs sont tracées ci-dessus.
Ensuite, nous dessinons une boîte et utilisons certaines des lignes pour nous guider. Le premier quartile est le côté gauche de notre boîte. Le troisième quartile est le côté droit de notre boîte. La médiane tombe n'importe où à l'intérieur de la boîte.
Selon la définition des premier et troisième quartiles, la moitié de toutes les valeurs de données sont contenues dans la boîte.
Nous voyons maintenant comment un graphique en boîte et moustaches obtient la deuxième partie de son nom. Des moustaches sont dessinées pour montrer la gamme des données. Tracez une ligne horizontale à partir de la ligne pour le minimum vers le côté gauche de la boîte au premier quartile. Ceci est l'un de nos moustaches. Tracez une deuxième ligne horizontale du côté droit de la boîte au troisième quartile jusqu'à la ligne représentant le maximum des données. Ceci est notre deuxième moustache.
Notre graphique en boîte et moustaches, ou boxplot, est maintenant terminé. En un coup d'œil, nous pouvons déterminer la plage des valeurs des données et le degré de regroupement de tout. L'étape suivante montre comment comparer et contraster deux boîtes à moustaches.
Les graphiques encadrés et moustaches affichent le résumé à cinq chiffres d'un ensemble de données. Deux ensembles de données différents peuvent ainsi être comparés en examinant ensemble leurs boîtes à moustaches. Au-dessus, un deuxième boxplot a été tracé au-dessus de celui que nous avons construit.
Il y a quelques fonctionnalités qui méritent d'être mentionnées. La première est que les médianes des deux ensembles de données sont identiques. La ligne verticale à l'intérieur des deux cases est au même endroit sur la ligne numérique. La deuxième chose à noter à propos des deux graphiques en boîte et moustaches est que l'intrigue du haut n'est pas aussi étalée que celle du bas. La boîte supérieure est plus petite et les moustaches ne s'étendent pas aussi loin.
Le dessin de deux boîtes à moustaches au-dessus de la même droite numérique suppose que les données derrière chacune méritent d'être comparées. Il serait insensé de comparer une boîte à moustaches de hauteurs de troisième année avec des poids de chiens dans un refuge local. Bien que les deux contiennent des données au rapport niveau de mesure, il n'y a aucune raison de comparer les données.
D'un autre côté, il serait logique de comparer les boîtes à moustaches des hauteurs des élèves de troisième année si une parcelle représentaient les données des garçons dans une école, et l'autre graphique représentait les données des filles l'école.