En effectuant un test de signification ou test d'hypothèse, il existe deux nombres faciles à confondre. Ces nombres sont facilement confondus car ils sont tous les deux des nombres entre zéro et un, et sont tous deux des probabilités. Un nombre est appelé la valeur p de la statistique de test. L'autre nombre d'intérêt est le niveau de signification ou alpha. Nous examinerons ces deux probabilités et déterminerons la différence entre elles.
Valeurs alpha
Le nombre alpha est la valeur seuil que nous mesurons valeurs p contre. Il nous indique à quel point les résultats observés doivent être extrêmes pour rejeter l'hypothèse nulle d'un test de signification.
La valeur de alpha est associée au niveau de confiance de notre test. Ce qui suit répertorie certains niveaux de confiance avec leurs valeurs alpha correspondantes:
- Pour les résultats avec un niveau de confiance de 90%, la valeur de alpha est 1 - 0,90 = 0,10.
- Pour des résultats avec 95% niveau de confiance, la valeur de alpha est 1 - 0,95 = 0,05.
- Pour les résultats avec un niveau de confiance de 99%, la valeur de alpha est 1 - 0,99 = 0,01.
- Et en général, pour les résultats avec un niveau de confiance C pour cent, la valeur de alpha est 1 - C / 100.
Bien qu'en théorie et en pratique de nombreux nombres puissent être utilisés pour l'alpha, le plus couramment utilisé est 0,05. La raison en est à la fois parce que le consensus montre que ce niveau est approprié dans de nombreux cas, et historiquement, il a été accepté comme standard. Cependant, il existe de nombreuses situations où une valeur alpha plus petite doit être utilisée. Il n'y a pas une seule valeur de alpha qui détermine toujours la signification statistique.
La valeur alpha nous donne la probabilité d'un erreur de type I. Des erreurs de type I se produisent lorsque nous rejetons une hypothèse nulle qui est réellement vraie. Ainsi, à long terme, pour un test avec un niveau de signification de 0,05 = 1/20, une vraie hypothèse nulle sera rejetée une fois sur 20.
Valeurs P
L'autre nombre qui fait partie d'un test de signification est une valeur de p. Une valeur p est également une probabilité, mais elle provient d'une source différente de l'alpha. Chaque statistique de test a une probabilité ou une valeur p correspondante. Cette valeur est la probabilité que la statistique observée se soit produite uniquement par hasard, en supposant que l'hypothèse nulle est vraie.
Puisqu'il existe un certain nombre de statistiques de test différentes, il existe un certain nombre de façons différentes de trouver une valeur de p. Dans certains cas, nous devons connaître distribution de probabilité de la population.
La valeur de p de la statistique de test est une façon de dire à quel point cette statistique est extrême pour nos données d'échantillon. Plus la valeur p est petite, plus l'échantillon observé est peu probable.
Différence entre la valeur P et l'alpha
Pour déterminer si un résultat observé est statistiquement significatif, nous comparons les valeurs de alpha et de la valeur p. Deux possibilités se dégagent:
- La valeur de p est inférieure ou égale à alpha. Dans ce cas, nous rejetons l'hypothèse nulle. Lorsque cela se produit, nous disons que le résultat est statistiquement significatif. En d'autres termes, nous sommes raisonnablement sûrs qu'il y a autre chose que le hasard qui nous a donné un échantillon observé.
- La valeur de p est supérieure à alpha. Dans ce cas, nous ne rejetons pas la hypothèse nulle. Lorsque cela se produit, nous disons que le résultat n'est pas statistiquement significatif. En d'autres termes, nous sommes raisonnablement sûrs que nos données observées peuvent être expliquées uniquement par hasard.
L'implication de ce qui précède est que plus la valeur de alpha est petite, plus il est difficile de prétendre qu'un résultat est statistiquement significatif. En revanche, plus la valeur de l'alpha est élevée, plus il est facile d'affirmer qu'un résultat est statistiquement significatif. À cela s'ajoute toutefois la probabilité plus élevée que ce que nous avons observé puisse être attribué au hasard.