Un histogramme est un type de graphique qui a de larges applications en statistique. Les histogrammes fournissent une interprétation visuelle de donnees numeriques en indiquant le nombre de points de données situés dans une plage de valeurs. Ces plages de valeurs sont appelées classes ou bacs. La fréquence des données qui tombent dans chaque classe est représentée par l'utilisation d'une barre. Plus la barre est haute, plus la fréquence des valeurs de données dans cette case est élevée.
Histogrammes vs Graphiques à barres
À première vue, les histogrammes ressemblent beaucoup à graphiques à barres. Les deux graphiques utilisent des barres verticales pour représenter les données. La hauteur d'une barre correspond à la fréquence relative de la quantité de données dans la classe. Plus la barre est haute, plus la fréquence des données est élevée. Plus la barre est basse, plus la fréquence des données est faible. Mais les apparences peuvent être trompeuses. C'est ici que s'arrêtent les similitudes entre les deux types de graphes.
La raison pour laquelle ces types de graphiques sont différents est liée à la niveau de mesure des données. D'une part, des graphiques à barres sont utilisés pour les données au niveau nominal de mesure. Graphiques à barres mesurer la fréquence des données catégorielles, et les classes d'un graphique à barres sont ces catégories. D'un autre côté, les histogrammes sont utilisés pour des données qui sont au moins niveau ordinal de mesure. Les classes d'un histogramme sont des plages de valeurs.
Une autre différence clé entre les graphiques à barres et les histogrammes est liée à l'ordre des barres. Dans un graphique à barres, il est courant de réorganiser les barres par ordre décroissant de hauteur. Cependant, les barres d'un histogramme ne peuvent pas être réorganisées. Ils doivent être affichés dans l'ordre où les classes se produisent.
Exemple d'histogramme
Le diagramme ci-dessus nous montre un histogramme. Supposons que quatre pièces soient retournées et que les résultats soient enregistrés. L'utilisation des table de distribution binomiale ou des calculs simples avec la formule binomiale montrent que la probabilité qu'aucune tête ne montre est 1/16, la probabilité qu'une tête montre est 4/16. La probabilité de deux têtes est de 6/16. La probabilité de trois têtes est de 4/16. La probabilité de quatre têtes est de 1/16.
Nous construisons un total de cinq classes, chacune de largeur un. Ces classes correspondent au nombre de têtes possibles: zéro, un, deux, trois ou quatre. Au-dessus de chaque classe, nous dessinons une barre verticale ou un rectangle. Les hauteurs de ces barres correspondent aux probabilités mentionnées pour notre expérience de probabilité de lancer quatre pièces et de compter les têtes.
Histogrammes et probabilités
L'exemple ci-dessus montre non seulement la construction d'un histogramme, mais il montre également que distributions de probabilité discrètes peut être représenté par un histogramme. En effet, une distribution de probabilité discrète peut être représentée par un histogramme.
Pour construire un histogramme qui représente une distribution de probabilité, nous commençons par sélectionner les classes. Ce devraient être les résultats d'une expérience de probabilité. La largeur de chacune de ces classes doit être d'une unité. Les hauteurs des barres de l'histogramme sont les probabilités pour chacun des résultats. Avec un histogramme construit de cette manière, les zones des barres sont également des probabilités.
Étant donné que ce type d'histogramme nous donne des probabilités, il est soumis à quelques conditions. Une stipulation est que seuls des nombres non négatifs peuvent être utilisés pour l'échelle qui nous donne la hauteur d'une barre donnée de l'histogramme. Une deuxième condition est que, puisque la probabilité est égale à la surface, toutes les surfaces des barres doivent s'additionner à un total, équivalent à 100%.
Histogrammes et autres applications
Les barres d'un histogramme n'ont pas besoin d'être des probabilités. Les histogrammes sont utiles dans des domaines autres que la probabilité. Chaque fois que nous souhaitons comparer la fréquence d'occurrence des données quantitatives, un histogramme peut être utilisé pour représenter notre ensemble de données.