Les tests d'hypothèse ou test de signification impliquent le calcul d'un nombre connu sous le nom de valeur p. Ce nombre est très important pour la conclusion de notre test. Les valeurs de p sont liées à la statistique de test et nous donnent une mesure des preuves par rapport à l'hypothèse nulle.
Hypothèses nulles et alternatives
Les tests de signification statistique commencent tous par nul et une hypothèse alternative. L'hypothèse nulle est la déclaration de non-effet ou une déclaration de situation communément admise. L'hypothèse alternative est ce que nous essayons de prouver. L'hypothèse de travail dans un test d'hypothèse est que l'hypothèse nulle est vraie.
Statistique de test
Nous supposerons que les conditions sont remplies pour le test particulier avec lequel nous travaillons. UNE échantillon aléatoire simple nous donne des exemples de données. À partir de ces données, nous pouvons calculer une statistique de test. Les statistiques des tests varient considérablement en fonction des paramètres de notre test d'hypothèse. Certaines statistiques de test courantes incluent:
- z - statistique des tests d'hypothèses concernant la moyenne de la population, lorsque l'on connaît l'écart type de la population.
- t - statistique des tests d'hypothèses concernant la moyenne de la population, lorsque nous ne connaissons pas l'écart type de la population.
- t - statistique des tests d'hypothèse concernant la différence de deux moyennes de population indépendante, lorsque l'on ne connaît pas l'écart type de l'une ou l'autre des deux populations.
- z - statistique des tests d'hypothèses concernant une proportion de la population.
- Chi carré - statistique pour les tests d'hypothèse concernant la différence entre un dénombrement prévu et réel pour les données catégorielles.
Calcul des valeurs P
Les statistiques de test sont utiles, mais il peut être plus utile d'attribuer une valeur de p à ces statistiques. Une valeur de p est la probabilité que, si l'hypothèse nulle était vraie, nous observerions une statistique au moins aussi extrême que celle observée. Pour calculer une valeur de p, nous utilisons le logiciel ou le tableau statistique approprié qui correspond à notre statistique de test.
Par exemple, nous utiliserions un distribution normale standard lors du calcul d'un z statistique de test. Valeurs de z avec de grandes valeurs absolues (comme celles supérieures à 2,5) ne sont pas très courantes et donneraient une petite valeur p. Valeurs de z qui sont plus proches de zéro sont plus courants et donneraient des valeurs de p beaucoup plus élevées.
Interprétation de la valeur P
Comme nous l'avons noté, une valeur p est une probabilité. Cela signifie qu'il s'agit d'un nombre réel compris entre 0 et 1. Alors qu'une statistique de test est un moyen de mesurer à quel point une statistique est extrême pour un échantillon particulier, les valeurs de p sont un autre moyen de mesurer cela.
Lorsque nous obtenons un échantillon statistique donné, la question que nous devons toujours nous poser est: «Cet échantillon est-il comme par hasard seul avec une vraie hypothèse nulle, ou l'hypothèse nulle est-elle fausse? " Si notre valeur de p est petite, cela pourrait signifier l'un des deux des choses:
- L'hypothèse nulle est vraie, mais nous avons eu beaucoup de chance d'obtenir notre échantillon observé.
- Notre échantillon est la façon dont il est dû au fait que l'hypothèse nulle est fausse.
En général, plus la valeur de p est petite, plus nous avons de preuves contre notre hypothèse nulle.
Comment petit est-il assez petit?
De quelle petite valeur p avons-nous besoin pour rejeter l'hypothèse nulle? La réponse à cette question est: «Cela dépend». Une règle d'or courante est que la valeur de p doit être inférieure ou égale à 0,05, mais cette valeur n'a rien d'universel.
En règle générale, avant de procéder à un test d'hypothèse, nous choisissons une valeur seuil. Si nous avons une valeur de p inférieure ou égale à ce seuil, alors nous rejetons l'hypothèse nulle. Sinon, nous ne parvenons pas à rejeter l'hypothèse nulle. Ce seuil est appelé le niveau de signification de notre test d'hypothèse et est désigné par la lettre grecque alpha. Il n'y a pas valeur d'alpha qui définit toujours la signification statistique.