Dans statistiques déductives, intervalles de confiance pour proportions de la population s'appuyer sur la distribution normale standard pour déterminer des paramètres inconnus d'une population donnée à partir d'un échantillon statistique de la population. Une des raisons en est que pour des tailles d’échantillons appropriées, distribution normale standard fait un excellent travail pour estimer un distribution binomiale. Ceci est remarquable car bien que la première distribution soit continue, la seconde est discrète.
Un certain nombre de problèmes doivent être traités lors de la construction d'intervalles de confiance pour les proportions. L’une d’elles concerne ce que l’on appelle un intervalle de confiance «plus quatre», ce qui estimateur biaisé. Cependant, cet estimateur d'une proportion de population inconnue donne de meilleurs résultats dans certaines situations que estimateurs non biaisés, en particulier les situations où il n'y a pas de succès ou d'échecs dans le Les données.
Dans la plupart des cas, la meilleure tentative pour estimer une proportion de la population consiste à utiliser une proportion d'échantillon correspondante. Nous supposons qu'il y a une population avec une proportion inconnue
p de ses individus contenant un certain trait, alors nous formons un simple échantillon aléatoire de taille n de cette population. De ces n les individus, nous en comptons le nombre Oui qui possèdent le trait qui nous intéresse. Maintenant, nous estimons p en utilisant notre échantillon. La proportion d'échantillon O / n est un estimateur non biaisé de p.Quand utiliser l'intervalle de confiance Plus Four
Lorsque nous utilisons un intervalle de plus quatre, nous modifions l'estimateur de p. Nous faisons cela en ajoutant quatre au nombre total d'observations, expliquant ainsi l'expression «plus quatre». Nous avons ensuite divisé ces quatre observations entre deux succès hypothétiques et deux échecs, ce qui signifie que nous ajoutons deux au nombre total de succès. Le résultat final est que nous remplaçons chaque instance de O / n avec (Oui + 2)/(n + 4), et parfois cette fraction est désignée par p avec un tilde au-dessus.
La proportion de l'échantillon fonctionne généralement très bien pour estimer une proportion de la population. Cependant, dans certaines situations, nous devons légèrement modifier notre estimateur. La pratique statistique et la théorie mathématique montrent que la modification de l'intervalle plus quatre est appropriée pour atteindre cet objectif.
Une situation qui devrait nous amener à considérer un intervalle de plus quatre est un échantillon déséquilibré. Plusieurs fois, en raison de la proportion de la population si petite ou si grande, la proportion de l'échantillon est également très proche de 0 ou très proche de 1. Dans ce type de situation, nous devrions considérer un intervalle de plus quatre.
Une autre raison d'utiliser un intervalle de plus quatre est que nous avons un petit échantillon. Un intervalle de plus quatre dans cette situation fournit une meilleure estimation pour une proportion de la population que l'utilisation de l'intervalle de confiance typique pour une proportion.
Règles d'utilisation de l'intervalle de confiance Plus Four
L'intervalle de confiance plus quatre est un moyen presque magique de calculer plus précisément les statistiques inférentielles en ajoutant simplement quatre imaginaires observations à un ensemble de données donné, deux succès et deux échecs, il est capable de prédire avec plus de précision la proportion d'un ensemble de données qui correspond à la paramètres.
Cependant, l'intervalle de confiance de plus quatre n'est pas toujours applicable à chaque problème. Il ne peut être utilisé que lorsque l'intervalle de confiance d'un ensemble de données est supérieur à 90% et que la taille de l'échantillon de la population est d'au moins 10. Cependant, l'ensemble de données peut contenir n'importe quel nombre de réussites et d'échecs, bien qu'il fonctionne mieux lorsqu'il n'y a ni succès ni échec dans les données d'une population donnée.
Gardez à l'esprit que contrairement aux calculs des statistiques régulières, les calculs des statistiques inférentielles reposent sur un échantillonnage de données pour déterminer les résultats les plus probables au sein d'une population. Bien que l'intervalle de confiance de plus quatre corrige pour un plus grand marge d'erreur, cette marge doit encore être prise en compte pour fournir l'observation statistique la plus précise.