Théorème de Mercer

Un article de Wikipédia, l'encyclopédie libre.

En mathématiques et en analyse fonctionnelle le théorème de Mercer est une représentation d'une fonction symétrique définie positive par le carré d'une série convergente de produits de fonctions. Ce théorème est l'un des résultats phares de James Mercer[1]. C'est un outil théorique important dans la théorie des équations intégrales. Il est aussi utilisé dans la théorie hilbertienne des processus stochastiques (voir théorème de Karhunen-Loève, Transformée de Karhunen-Loève).

Sommaire

[modifier] Introduction

Pour expliquer le théorème de Mercer, commençons par un cas particulier important; voir plus bas pour une formulation plus générale.

Le terme noyau, dans ce contexte, est une fonction continue

 K: [a,b] \times [a,b] \rightarrow \mathbb{R}

telle que K(x, s) = K(s, x).

K est dite définie non négative si et seulement si

 \sum_{i=1}^n\sum_{j=1}^n K(x_i, x_j) c_i c_j \geq 0

pour toute suites finies de points x1,...,xn de [a, b] et tout choix des réels c1, ..., cn (cf. noyau défini positif).

A K on associe l'opérateur linéaire défini par l'intégrale

 [T_K \varphi](x) =\int_a^b  K(x,s) \varphi(s)\, ds.

Pour des raisons techniques nous supposerons que φ peut parcourir l'espace L2[ab] (voir Espace Lp) des fonctions réelles de carré intégrable. Comme T est un opérateur linéaire, on peut parler de valeurs propres et de fonctions propres de T.

Théorème. Soit K une fonction noyau continue symétrique définie non négative. Alors il existe une base orthonormée {ei}i de L2[a,b] consistant en les fonctions propres de TK telle que la suite des valeurs propres correspondantes {λi}i est non négative. Les fonctions propres correspondant aux valeurs propres non nulles sont continues sur [a, b] et K admet la représentation

 K(s,t) = \sum_{j=1}^\infty \lambda_j \, e_j(s) \, e_j(t)

où la convergence est absolue et uniforme.

[modifier] Détails

Donnons avec force détails la structure de la preuve du théorème de Mercer, particulièrement dans ses rapports avec la théorie spectrale des opérateurs compacts.

  • L'application KTK est injective.
  • TK est un opérateur compact non-négatif et symétrique sur L2[a,b]; De plus K(x, x) ≥ 0.

Pour montrer la compacité, regardons l'image de la boule unité de L2[a,b] par TK équicontinu. Appliquant le théorème d'Ascoli, cela montre que l'image de la boule unité est relativement compact dans C([a,b]) muni de la norme de la convergence uniforme et a fortiori dans L2[a,b].

Appliquons le théorème spectral des opérateurs compacts pour les espaces de Hilbert à TK pour montrer l'existence d'une base orthonormale {ei}i de L2[a,b]

 \lambda_i e_i(t)= [T_K e_i](t)  = \int_a^b K(t,s) e_i(s)\, ds.

Si λi ≠ 0, le vecteur propre ei est continue sur [a,b]. Or

 \sum_{i=1}^\infty \lambda_i |e_i(t) e_i(s)| \leq \sup_{x \in [a,b]} |K(x,x)|^2,

ce qui montre que la suite

 \sum_{i=1}^\infty \lambda_i e_i(t) e_i(s)

converge absolument et uniformément vers un noyau kernel K0 qu'il est aisé de voir qu'il définit le même opérateur que le noyau K. Donc K=K0 d'où le théorème de Mercer.

[modifier] Trace

Ce qui suit est immédiat:

Théorème. Soit K un noyau continu symétrique défini non-negatif et TK un opérateur ayant une suite de valeurs propres non négatives {λi}i. Alors

 \int_a^b K(t,t)\, dt = \sum_i \lambda_i.

Cela montre que l'opérateur TK est un opérateur de trace et

 \operatorname{trace}(T_K) = \int_a^b K(t,t)\, dt.

[modifier] Généralisations

Le théorème se généralise en remplaçant l'intervalle [ab] par un espace de Hausdorff compact, la mesure de Lebesgue sur [ab] étant remplacée par une mesure dénombrablement additive finie μ sur les boréliens de X à support X. Cela signifiant que μ(U) > 0 pour tout ouvert U de X. Alors on a essentiellement le même résultat:

Théorème. Soit K un noyau continu symétrique défini non négatif sur X. Alors il existe une base orthonormale {ei}i de L2μ(X) consistant en les fonctions propres de TK telle que la suite des valeurs propres correspondantes {λi}i soit non négative. Les fonctions propres correspondant aux valeurs propres non nulles sont continues sur X et K s'écrit

 K(s,t) = \sum_{j=1}^\infty \lambda_j \, e_j(s) \, e_j(t)

où la convergence est absolue et uniforme sur X.

La généralisation suivante porte sur la représentation des noyaux mesurables.

Soit (X, M, μ) un espace de σ-mesurable finie. Un L2 noyau sur X est une fonction

 K \in L^2_{\mu \otimes \mu}(X \times X).

Les L2 noyaux définissent un opérateur borné TK par la formule

 \langle T_K \varphi, \psi \rangle = \int_{X \times X} K(y,x) \varphi(y) \psi(x) \,d[\mu \otimes \mu](y,x).

TK est un opérateur compact (c'est même un opérateur d'Hilbert-Schmidt). Si le noyau K est symétrique, par le théorème spectral des opérateur auto-adjoints dans un espace de Hilbert, TK admet une base orthonormale de vecteurs propres. Ces vecteurs propres correspondent aux valeurs propres non nulles et forment une suite {ei}i (indépendamment de la séparabilité).

Théorème. Si K est un noyau symétrique défini non négatif sur (X, M, μ), alors on a

 K(y,x) = \sum_{i \in \mathbb{N}} \lambda_i e_i(y) e_i(x)

qui converge selon la norme L2. Noter que si la continuité du noyau n'est plus supposée, le développement ne converge plus nécessairement uniformément.

[modifier] Notes et références

  1. James Mercer, « Functions of positive and negative type and their connection with the theory of integral equations. », dans Philos. Trans. Roy. Soc. London, 209

[modifier] Bibliographie

  • Adriaan Zaanen, Linear Analysis, North Holland Publishing Co., 1960
  • Jörgens Konrad, Linear integral operators, Pitman, Boston, 1982
  • Richard Courant and David Hilbert, Methods of Mathematical Physics, vol 1, Interscience 1953,
  • Robert Ash, Information Theory, Dover Publications, 1990
  • H. König, Eigenvalue distribution of compact operators, Birkhäuser Verlag, 1986 (donne une généralisation du théorème de Mercer pour une mesure finie μ).
Autres langues