Médiane (centre)

Un article de Wikipédia, l'encyclopédie libre.

En théorie des probabilités et en statistiques, la médiane est un nombre qui divise en deux parties l'échantillon, la population ou la distribution de probabilités. Chaque partie contient le même nombre de valeurs.

Dans une liste finie de valeurs, il suffit d'ordonner les valeurs dans un ordre croissant et de choisir la valeur centrale comme médiane. S'il y a un nombre pair de valeurs, la moyenne arithmétique des deux valeurs centrales est souvent prise (mais toute valeur entre les deux est acceptable).

Contrairement à la moyenne arithmétique, la valeur médiane permet d'atténuer l'influence perturbatrice des valeurs extrêmes enregistrées lors de circonstances exceptionnelles.

Sommaire

[modifier] Vulgarisation

Supposons 19 pauvres et un milliardaire dans une pièce. Tous prennent l'argent de leur poche et le déposent sur une table. Chaque pauvre dépose 5 dollars, alors que le milliardaire met 1 milliard de dollars. Le montant total est 1 000 000 095 dollars. Si cet argent est également distribué parmi les vingt personnes, chacune obtient 50 000 004,75 dollars. Ce montant est la valeur moyenne de ce qu'elles ont amené. Cependant, la valeur médiane est de 5 dollars, puisque le groupe peut être divisé en deux parties égales de 10 personnes. On peut donc affirmer que tous les membres du premier groupe ont amené au plus 5 dollars, alors que les membres du deuxième groupe ont amené au moins 5 dollars. En se basant sur cet exemple, la médiane représente ce qu'une personne typique amène. Au contraire, la moyenne n'est pas représentative, puisque aucune des personnes présentes n'a apporté un montant proche de 50 000 004,75 dollars.

[modifier] Valeur non-unique

Théoriquement, il peut y avoir plus qu'une valeur médiane. Par exemple, s'il y a un nombre pair de valeurs, il existe différentes valeurs qui divisent l'ensemble en deux parties. Pour éviter cette situation, les statisticiens ont mis au point une formule qui génère exactement une seule valeur médiane. Elle vaut en général la moyenne des deux valeurs les plus proches de la médiane.

[modifier] Mesure de la dispersion statistique

Lorsque la médiane est utilisée pour situer des valeurs en statistiques descriptives, il existe différentes possibilités pour exprimer la variabilité : L'étendue, l'écart interquartile et l'écart absolu. Puisque la médiane est la même valeur que le deuxième quartile, son calcul est détaillé dans l'article sur les quartiles.

[modifier] Médianes dans les distributions de probabilités

Pour chacune des distributions de probabilités sur la ligne des nombres réels avec une fonction de distribution cumulative, F, peu importe s'il s'agit d'une distribution continue de probabilités ou d'une distribution discrète de probabilités, une médiane m satisfait l'égalité :

P(X\leq m)=P(X\geq m)=\int_{-\infty}^m dF(x)

dans laquelle une intégrale de Riemann-Stieltjes apparaît. Pour une distribution de probabilités absolument continue avec une densité de probabilité f, il y a :

P(X\leq m)=P(X\geq m)=\int_{-\infty}^m f(x)\, dx=0,5.

[modifier] Médianes de certaines distributions

[modifier] Médianes en statistiques descriptives

La médiane est principalement utilisée pour les distributions asymétriques, car elle les représente mieux que la moyenne arithmétique. Considérons l'ensemble { 1, 2, 2, 2, 3, 9 }. La médiane est 2, tout comme le mode, ce qui est une meilleure mesure de tendance centrale que la moyenne arithmétique égale à 3,166….

Le calcul de la médiane est couramment effectué pour représenter différentes distributions et elle est facile à comprendre, tout comme à calculer. Elle est aussi plus robuste que la moyenne en présence de valeurs extrêmes.

[modifier] Propriétés théoriques

[modifier] Propriété optimale

La médiane est aussi la valeur centrale qui minimise la valeur moyenne des écarts absolus. Dans la série donnée auparavant, ce serait (1 + 0 + 0 + 0 + 1 + 7) / 6 = 1,5, plutôt que 1,944 à partir de la moyenne. En théorie des probabailités, la valeur c qui minimise

E(\left|X-c\right|)\,

est la médiane de la distribution de probabilités de la variable aléatoire X.

[modifier] Inégalité impliquant les moyennes et les médianes

Pour les distributions continues de probabilités, la différence entre la médiane et la moyenne est d'au plus d'un écart type.

[modifier] Calcul efficace

Bien que le tri de n items prend en général O(n log n) opérations, il est possible de calculer la médiane de n items à l'aide de l'algorithme diviser pour régner en seulement O(n) opérations.

[modifier] Voir aussi

[modifier] Liens externes

modifier Articles de mathématiques en rapport avec les probabilités ou les statistiques
Statistiques descriptivesAnalyse des donnéesVisualisation des donnéesEstimateursTests statistiquesSéries temporelles et économétrieStatistique MathématiqueThéorie des probabilitésVariables aléatoiresInégalitésThéorèmes limitesProcessus stochastiquesLa mécanique statistiqueLes statistiques et l'économieLes statistiques et la sociologieLes statistiques et les sciencesLes probabilités et les jeux • Les équations aux dérivées partielles et les probabilités