Comment trouver les degrés de liberté dans les statistiques

click fraud protection

De nombreux problèmes d’inférence statistique nous obligent à trouver le nombre de degrés de liberté. Le nombre de degrés de liberté sélectionne un seul distribution de probabilité parmi une infinité de personnes. Cette étape est un détail souvent ignoré mais crucial dans le calcul desintervalles de confiance et le fonctionnement de tests d'hypothèse.

Il n'y a pas une seule formule générale pour le nombre de degrés de liberté. Cependant, il existe des formules spécifiques utilisées pour chaque type de procédure dans les statistiques inférentielles. En d'autres termes, le cadre dans lequel nous travaillons déterminera le nombre de degrés de liberté. Ce qui suit est une liste partielle de certaines des procédures d'inférence les plus courantes, ainsi que le nombre de degrés de liberté qui sont utilisés dans chaque situation.

Distribution normale standard

Procédures impliquant distribution normale standard sont répertoriés pour être complets et pour dissiper certaines idées fausses. Ces procédures ne nous obligent pas à trouver le nombre de degrés de liberté. La raison en est qu'il existe une seule distribution normale standard. Ces types de procédures englobent celles impliquant une moyenne de population lorsque l'écart-type de la population est déjà connu, ainsi que les procédures concernant les proportions de la population.

instagram viewer

Un exemple de procédures T

Parfois, la pratique statistique nous oblige à utiliser la distribution t de Student. Pour ces procédures, comme celles qui traitent d'une moyenne de population avec un écart-type de population inconnu, le nombre de degrés de liberté est inférieur de un à la taille de l'échantillon. Ainsi, si la taille de l'échantillon est n, alors il y a n - 1 degrés de liberté.

Procédures T avec données appariées

Plusieurs fois, il est logique de traiter les données comme appariées. L'appariement est généralement effectué en raison d'une connexion entre la première et la deuxième valeur de notre paire. Plusieurs fois, nous appairions avant et après les mesures. Notre échantillon de données appariées n'est pas indépendant; cependant, la différence entre chaque paire est indépendante. Ainsi, si l'échantillon a un total de n paires de points de données (pour un total de 2n puis il y a n - 1 degrés de liberté.

Procédures T pour deux populations indépendantes

Pour ces types de problèmes, nous utilisons toujours un t-distribution. Cette fois, il y a un échantillon de chacune de nos populations. Bien qu'il soit préférable que ces deux échantillons soient de la même taille, cela n'est pas nécessaire pour nos procédures statistiques. Ainsi, nous pouvons avoir deux échantillons de taille n1 et n2. Il existe deux façons de déterminer le nombre de degrés de liberté. La méthode la plus précise consiste à utiliser la formule de Welch, une formule de calcul complexe impliquant les tailles d’échantillons et les écarts-types d’échantillons. Une autre approche, appelée approximation conservatrice, peut être utilisée pour estimer rapidement les degrés de liberté. C'est simplement le plus petit des deux nombres n1 - 1 et n2 - 1.

Chi-Square pour l'indépendance

Une utilisation du test du chi carré est de voir si deux variables catégorielles, chacune avec plusieurs niveaux, présentent une indépendance. Les informations sur ces variables sont enregistrées dans un table bidirectionnelle avec r lignes et c Colonnes. Le nombre de degrés de liberté est le produit (r - 1)(c - 1).

Qualité d'ajustement du chi carré

La qualité d'ajustement du chi carré commence par une seule variable catégorielle avec un total de n les niveaux. Nous testons l'hypothèse que cette variable correspond à un modèle prédéterminé. Le nombre de degrés de liberté est inférieur de un au nombre de niveaux. En d'autres termes, il existe n - 1 degrés de liberté.

ANOVA à un facteur

Un facteur analyse de variance (ANOVA) nous permet de faire des comparaisons entre plusieurs groupes, éliminant ainsi le besoin de plusieurs tests d'hypothèse par paires. Puisque le test nous oblige à mesurer à la fois la variation entre plusieurs groupes ainsi que la variation au sein de chaque groupe, nous nous retrouvons avec deux degrés de liberté. le Statistique F, qui est utilisé pour un facteur ANOVA, est une fraction. Le numérateur et le dénominateur ont chacun des degrés de liberté. Laisser c être le nombre de groupes et n est le nombre total de valeurs de données. Le nombre de degrés de liberté du numérateur est inférieur de un au nombre de groupes, ou c - 1. Le nombre de degrés de liberté pour le dénominateur est le nombre total de valeurs de données, moins le nombre de groupes, ou n - c.

Il est clair que nous devons faire très attention à savoir avec quelle procédure d'inférence nous travaillons. Cette connaissance nous informera du nombre correct de degrés de liberté d'utilisation.

instagram story viewer