Comment calculer la médiane de la distribution exponentielle

le médian d'un ensemble de données est le point médian dans lequel exactement la moitié des valeurs de données sont inférieures ou égales à la médiane. De la même manière, nous pouvons penser à la médiane d'un continudistribution de probabilité, mais plutôt que de trouver la valeur moyenne dans un ensemble de données, nous trouvons le milieu de la distribution d'une manière différente.

L'aire totale sous une fonction de densité de probabilité est 1, ce qui représente 100%, et par conséquent, la moitié de celle-ci peut être représentée par un demi ou 50 pour cent. L'une des grandes idées de la statistique mathématique est que la probabilité est représentée par l'aire sous la courbe de la fonction de densité, qui est calculée par une intégrale, et donc la médiane d'une distribution continue est le point sur le nombre réel ligne où exactement la moitié de la zone se trouve à gauche.

Cela peut être plus succinctement indiqué par l'intégrale incorrecte suivante. La médiane de la variable aléatoire continue X avec fonction densité F( X) est la valeur M telle que:

instagram viewer

0.5=mF(X)X0,5 = \ int_ {m} ^ {- \ infty} f (x) dx0.5=mF(X)X

Médiane pour la distribution exponentielle

Nous calculons maintenant la médiane de la distribution exponentielle Exp (A). Une variable aléatoire avec cette distribution a une fonction de densité F(X) = e-X/UNE/ A pour X tout nombre réel non négatif. La fonction contient également le constante mathématique e, approximativement égal à 2,71828.

Étant donné que la fonction de densité de probabilité est nulle pour toute valeur négative de X, tout ce que nous devons faire est d'intégrer ce qui suit et de résoudre pour M:

0,5 = ∫0M f (x) dx

Puisque l'intégrale ∫ e-X/UNE/Un dX = -e-X/UNE, le résultat est que

0,5 = -e-M / A + 1

Cela signifie que 0,5 = e-M / A et après avoir pris le logarithme naturel des deux côtés de l'équation, nous avons:

ln (1/2) = -M / A

Puisque 1/2 = 2-1, par propriétés des logarithmes nous écrivons:

- ln2 = -M / A

La multiplication des deux côtés par A nous donne le résultat que la médiane M = A ln2.

Inégalité moyenne médiane dans les statistiques

Une conséquence de ce résultat est à mentionner: la moyenne de la distribution exponentielle Exp (A) est A, et comme ln2 est inférieur à 1, il s'ensuit que le produit Aln2 est inférieur à A. Cela signifie que la médiane de la distribution exponentielle est inférieure à la moyenne.

Cela a du sens si nous pensons au graphique de la fonction de densité de probabilité. En raison de la longue queue, cette distribution est asymétrique vers la droite. Souvent, lorsqu'une distribution est biaisée vers la droite, la moyenne se situe à droite de la médiane.

Ce que cela signifie en termes d'analyse statistique, c'est que nous pouvons souvent prédire que la moyenne et la médiane ne corréler étant donné la probabilité que les données soient biaisées vers la droite, ce qui peut être exprimé comme la preuve de l'inégalité moyenne médiane connu comme L'inégalité de Tchebychev.

Par exemple, considérons un ensemble de données qui postule qu'une personne reçoit un total de 30 visiteurs en 10 heures, où le temps d'attente moyen pour un visiteur est de 20 minutes, alors que l'ensemble de données peut présenter que le temps d'attente médian se situerait entre 20 et 30 minutes si plus de la moitié de ces visiteurs venaient dans les cinq premiers heures.