Test de Kolmogorov-Smirnov

Un article de Wikipédia, l'encyclopédie libre.

En statistiques, le test de Kolmogorov-Smirnov est un test d'hypothèse utilisé pour déterminer si un échantillon suit bien une loi donnée connue par sa fonction de répartition continue, ou bien si deux échantillons suivent la même loi.

Ce test repose sur les propriétés des fonctions de répartition empirique : si (x_1,\dots,x_n) est un échantillon de n variables aléatoires indépendantes à valeurs réelles, alors la fonction de répartition empirique de cet échantillon est définie par F_n(x)={1 \over n}\sum_{i=1}^n \delta_{x_i\leq x} avec \delta_{x_i\leq x} = \left\{\begin{matrix}1 & \mathrm{si}\ x_i\leq x, \\ 0 & \mathrm{sinon}.\end{matrix}\right.

La fonction de répartition empirique est un processus qui prend ses valeurs dans l'espace des fonctions croissantes comprises entre 0 et 1. Grâce à ses propriétés, on a la convergence suivante :


\mathbb{P}\left[
\sup_{x} |F_n(x)-F(x)|>\frac{c}{\sqrt{n}}
\right]\xrightarrow[n\to\infty]{} \alpha(c)=
2\sum_{r=1}^{+\infty} (-1)^{r-1}\exp(-2r^2c^2)

pour toute constante c > 0. Le terme α(c) vaut 0.05 pour c = 1.36. Remarquons que la limite à droite ne dépend pas de F. Cela découle du fait que \sqrt{n}(F_n(x)-F(x)) converge en loi vers un pont brownien changé de temps par l'inverse F − 1 de F. La série α(c) se déduit des propriétés de ce dernier processus.

Il est ainsi facile de proposer un test d'hypothèse pour décider si un échantillon provient bien d'une loi donnée, ou si deux échantillons ont la même loi, lorsque leurs fonction de répartitions sont continues.

On peut aussi considérer maxx(Fn(x) − F(x)) et maxx(F(x) − Fn(x)).

Le test de Kolmogorov-Smirnov est par exemple utilisé pour tester la qualité d'un générateur de nombres aléatoires[1].

Sommaire

[modifier] Voir aussi

  • test de Kuiper
  • test de Shapiro-Wilk
  • test d'Anderson-Darling
  • critère de Cramér-von-Mises

[modifier] Références

  • (en) Galen R. Shorack et Jon A. Wellner, Empirical Processes With Applications to Statistics, John Wiley & Sons Inc, 1986, 976 p. (ISBN 047186725X).
  • (en) David Williams, Weighing the Odds: a Course in Probability and Statistics, Cambridge University Press, 2001, 548 p. (ISBN 052180356X).

[modifier] Notes

  1. (en) Donald E. Knuth, The Art of Computer Programming, vol. 2, 3e éd., Addison-Wesley Professional, 784 p. (ISBN 0201896842), p. 48–55.

[modifier] Liens externes