Comment estimer les écarts-types (ET)

L'écart type et la plage sont tous deux des mesures de la diffusion d'un ensemble de données. Chaque nombre nous indique à sa manière à quel point les données sont espacées, car elles sont toutes deux une mesure de la variation. Bien qu’il n’existe pas de relation explicite entre les gamme et écart type, Il y a un règle d'or cela peut être utile pour relier ces deux statistiques. Cette relation est parfois appelée règle de plage pour l'écart type.

La règle de l'intervalle nous indique que l'écart type d'un échantillon est approximativement égal au quart de l'intervalle des données. En d'autres termess = (Maximum - Minimum) / 4. Il s'agit d'une formule très simple à utiliser et ne doit être utilisée que comme estimation de l'écart type.

Un exemple

Pour voir un exemple du fonctionnement de la règle de plage, nous allons voir l'exemple suivant. Supposons que nous commençons avec les valeurs de données de 12, 12, 14, 15, 16, 18, 18, 20, 20, 25. Ces valeurs ont un signifier de 17 et un écart type d'environ 4,1. Si au lieu de cela, nous calculons d'abord la plage de nos données comme 25 - 12 = 13, puis diviser ce nombre par quatre, nous avons notre estimation de l'écart type comme 13/4 = 3,25. Ce nombre est relativement proche de la véritable déviation standard et bon pour une estimation approximative.

instagram viewer

Pourquoi ça marche?

Il peut sembler que la règle de plage est un peu étrange. Pourquoi ça marche? Ne semble-t-il pas complètement arbitraire de simplement diviser la plage par quatre? Pourquoi ne diviserions-nous pas par un nombre différent? Il y a en fait une justification mathématique en cours dans les coulisses.

Rappelez les propriétés du courbe en cloche et les probabilités d'un distribution normale standard. Une caractéristique concerne la quantité de données qui se situe dans un certain nombre d'écarts-types:

  • Environ 68% des données se trouvent dans un écart-type (supérieur ou inférieur) de la moyenne.
  • Environ 95% des données se situent à moins de deux écarts-types (supérieurs ou inférieurs) de la moyenne.
  • Environ 99% se situe dans les trois écarts-types (supérieurs ou inférieurs) de la moyenne.

Le nombre que nous utiliserons concerne 95%. Nous pouvons dire que 95% de deux écarts-types au-dessous de la moyenne à deux écarts-types au-dessus de la moyenne, nous avons 95% de nos données. Ainsi, la quasi-totalité de notre distribution normale s'étendrait sur un segment de ligne qui est un total de quatre écarts-types.

Toutes les données ne sont pas normalement distribuées et en forme de courbe en cloche. Mais la plupart des données se comportent suffisamment bien pour que l'écart de deux écarts types par rapport à la moyenne capture presque toutes les données. Nous estimons et disons que quatre écarts-types sont approximativement de la taille de la plage, et donc la plage divisée par quatre est une approximation approximative de l'écart-type.

Utilisations pour la règle de plage

La règle de plage est utile dans un certain nombre de paramètres. Tout d'abord, il s'agit d'une estimation très rapide de l'écart type. L'écart type nous oblige à trouver d'abord la moyenne, puis à soustraire cette moyenne de chaque point de données, carré les différences, ajoutez-les, divisez par un de moins que le nombre de points de données, puis (enfin) prenez le carré racine. En revanche, la règle de plage ne nécessite qu'une soustraction et une division.

Il existe d'autres endroits où la règle de plage est utile lorsque nous avons des informations incomplètes. Des formules telles que celle permettant de déterminer la taille de l'échantillon nécessitent trois informations: marge d'erreur, les niveau de confiance et l'écart type de la population que nous étudions. Souvent, il est impossible de savoir ce que la population écart-type est. Avec la règle de plage, nous pouvons estimer cette statistique, puis savoir dans quelle mesure nous devons faire notre échantillon.

instagram story viewer