Test d'hypothèse pour comparer deux proportions

Dans cet article, nous allons passer en revue les étapes nécessaires pour effectuer une test d'hypothèse, ou test de signification, pour la différence de deux proportions de population. Cela nous permet de comparer deux proportions inconnues et de déduire si elles ne sont pas égales l'une à l'autre ou si l'une est supérieure à l'autre.

Aperçu et contexte du test d'hypothèse

Avant d'entrer dans les détails de notre test d'hypothèse, nous examinerons le cadre des tests d'hypothèse. Dans un test de signification, nous essayons de montrer qu'une déclaration concernant la valeur d'une population paramètre (ou parfois la nature de la population elle-même) est probablement vraie.

Nous rassemblons des preuves de cette déclaration en effectuant une échantillon statistique. Nous calculons une statistique à partir de cet échantillon. La valeur de cette statistique est ce que nous utilisons pour déterminer la vérité de la déclaration d'origine. Ce processus contient de l'incertitude, mais nous pouvons quantifier cette incertitude

instagram viewer

Le processus global pour un test d'hypothèse est donné par la liste ci-dessous:

Assurez-vous que les conditions nécessaires à notre test sont remplies.
Énoncez clairement hypothèses nulles et alternatives. L'hypothèse alternative peut impliquer un test unilatéral ou bilatéral. Nous devons également déterminer le niveau de signification, qui sera indiqué par la lettre grecque alpha.
Calculez la statistique de test. Le type de statistique que nous utilisons dépend du test particulier que nous effectuons. Le calcul repose sur notre échantillon statistique.
Calculez le valeur p. La statistique de test peut être traduite en une valeur p. Une valeur de p est la probabilité que le hasard produise à lui seul la valeur de notre statistique de test en supposant que l'hypothèse nulle est vraie. La règle générale est que plus la valeur de p est petite, plus les preuves contre l'hypothèse nulle sont grandes.
Tirer une conclusion. Enfin, nous utilisons la valeur alpha qui a déjà été sélectionnée comme valeur seuil. La règle de décision est que si la valeur de p est inférieure ou égale à alpha, alors nous rejetons l'hypothèse nulle. Sinon, nous ne pas rejeter l'hypothèse nulle.

Maintenant que nous avons vu le cadre d'un test d'hypothèse, nous allons voir les détails d'un test d'hypothèse pour la différence de deux proportions de population.

Les conditions

Un test d'hypothèse pour la différence de deux proportions de population nécessite que les conditions suivantes soient remplies:

Nous avons deux échantillons aléatoires simples de grandes populations. Ici, «grande» signifie que la population est au moins 20 fois plus grande que la taille de l'échantillon. Les tailles d'échantillon seront désignées par n₁ et n₂.
Les individus de nos échantillons ont été choisis indépendamment les uns des autres. Les populations elles-mêmes doivent également être indépendantes.
Il y a au moins 10 succès et 10 échecs dans nos deux échantillons.

Tant que ces conditions sont remplies, nous pouvons continuer notre test d'hypothèse.

Les hypothèses nulles et alternatives

Maintenant, nous devons considérer les hypothèses pour notre test de signification. L'hypothèse nulle est notre déclaration d'absence d'effet. Dans ce type particulier de test d'hypothèse, notre hypothèse nulle est qu'il n'y a pas de différence entre les deux proportions de population. Nous pouvons écrire ceci comme H₀: p₁ = p₂.

L'hypothèse alternative est l'une des trois possibilités, selon les spécificités de ce que nous testons:

H_une: p₁ est supérieur à p₂. Il s'agit d'un test unilatéral ou unilatéral.
H_une: p₁ est inférieur à p₂. Il s'agit également d'un test unilatéral.
H_une: p₁ n'est pas égal à p₂. Ceci est un à deux queues ou test bilatéral.

Comme toujours, pour être prudent, nous devons utiliser l'hypothèse alternative bilatérale si nous n'avons pas de direction en tête avant d'obtenir notre échantillon. La raison pour cela est qu'il est plus difficile de rejeter l'hypothèse nulle avec un test bilatéral.

Les trois hypothèses peuvent être réécrites en précisant comment p₁ - p₂ est lié à la valeur zéro. Pour être plus précis, l'hypothèse nulle deviendrait H₀:p₁ - p₂= 0. Les hypothèses alternatives potentielles seraient écrites comme suit:

H_une: p₁ - p₂> 0 équivaut à la déclaration "p₁ est supérieur à p₂."
H_une: p₁ - p₂<0 équivaut à la déclaration "p₁ est inférieur à p₂."
H_une: p₁ - p₂≠ 0 équivaut à la déclaration "p₁ n'est pas égal à p₂."

Cette formulation équivalente nous montre en fait un peu plus de ce qui se passe dans les coulisses. Ce que nous faisons dans ce test d'hypothèse est de tourner les deux paramètres p₁ et p₂dans le paramètre unique p₁ - p_2. Nous testons ensuite ce nouveau paramètre par rapport à la valeur zéro.

La statistique de test

La formule de la statistique de test est donnée dans l'image ci-dessus. Une explication de chacun des termes suit:

L'échantillon de la première population a une taille n_1.Le nombre de succès de cet échantillon (qui n'est pas directement visible dans la formule ci-dessus) est k_1.
L'échantillon de la deuxième population a une taille n_2.Le nombre de succès de cet échantillon est k_2.
Les proportions d'échantillon sont p₁-chapeau = k₁ / n₁et P₂-hat = k₂ / n₂ .
Nous combinons ou regroupons ensuite les succès de ces deux échantillons et obtenons: p-chapeau = (k₁ + k₂) / (n₁+ n₂).

Comme toujours, faites attention à l'ordre des opérations lors du calcul. Tout en dessous du radical doit être calculé avant de prendre la racine carrée.

La valeur P

L'étape suivante consiste à calculer la valeur de p qui correspond à notre statistique de test. Nous utilisons une distribution normale standard pour nos statistiques et consultons un tableau de valeurs ou utilisons un logiciel statistique.

Les détails de notre calcul de la valeur p dépendent de l'hypothèse alternative que nous utilisons:

Pour H_une: p₁ - p₂> 0, nous calculons la proportion de la distribution normale supérieure à Z.
Pour H_une: p₁ - p₂<0, nous calculons la proportion de la distribution normale qui est inférieure à Z.
Pour H_une: p₁ - p₂≠ 0, nous calculons la proportion de la distribution normale supérieure à |Z|, la valeur absolue de Z. Après cela, pour tenir compte du fait que nous avons un test bilatéral, nous doublons la proportion.

Règle de décision

Nous décidons maintenant de rejeter l'hypothèse nulle (et donc d'accepter l'alternative) ou de ne pas rejeter l'hypothèse nulle. Nous prenons cette décision en comparant notre valeur de p au niveau de signification alpha.

Si la valeur de p est inférieure ou égale à alpha, alors nous rejetons l'hypothèse nulle. Cela signifie que nous avons un résultat statistiquement significatif et que nous allons accepter l'hypothèse alternative.
Si la valeur de p est supérieure à alpha, nous ne rejetons pas l'hypothèse nulle. Cela ne prouve pas que l'hypothèse nulle est vraie. Au lieu de cela, cela signifie que nous n'avons pas obtenu suffisamment de preuves convaincantes pour rejeter l'hypothèse nulle.

Note spéciale

le intervalle de confiance pour la différence de deux proportions de population ne regroupe pas les succès, contrairement au test d'hypothèse. La raison en est que notre hypothèse nulle suppose que p₁ - p₂= 0. L'intervalle de confiance ne le suppose pas. Certains statisticiens ne regroupent pas les succès de ce test d'hypothèse et utilisent plutôt une version légèrement modifiée de la statistique de test ci-dessus.