Théorie de la perturbation (mécanique quantique)

Un article de Wikipédia, l'encyclopédie libre.

En mécanique quantique, la théorie de la perturbation (ou théorie des perturbations) est un ensemble de schémas d'approximations liée à une perturbation mathématique utilisée pour décrire un système quantique complexe de façon simplifiée. L'idée est de partir d'un système simple et d'appliquer graduellement un hamiltonien « perturbant » qui représente un écart léger par rapport à l'équilibre du système (perturbation). Si la perturbation n'est pas trop importante, les différentes quantités physiques associées avec le système perturbé (comme ses niveaux d'énergie et états propres) seront générés de manière continue à partir de ceux du système simple. On peut donc par conséquent étudier le premier à partir des connaissances sur le dernier.

Sommaire

[modifier] Application de la théorie de la perturbation

La théorie de la perturbation est un outil important pour la description des systèmes quantiques réels, car trouver des solutions exactes à l'équation de Schrödinger pour des hamiltoniens de systèmes même modérément complexes peut être très difficile. Les hamiltoniens pour lesquels on connait des solutions exactes, comme pour l'atome d'hydrogène, de l'oscillateur harmonique quantique et la particule dans une boîte, sont trop idéalisés pour décrire de manière adéquate la plupart des systèmes. En utilisant la théorie de la perturbation, on peut utiliser les solutions connues de ces hamiltoniens simples pour générer des solutions pour une série de systèmes plus complexes. Ainsi, en ajoutant un potentiel électrique perturbateur au modèle quantique de l'atome d'hydrogène, on peut calculer les déplacements faibles des raies spectrales de l'hydrogène en raison de la présence d'un champ électrique (effet Stark). Ceci est seulement une approximation, la somme d'un potentiel coulombien avec un potentiel linéaire est instable bien que le temps tunnel (radioactivité) est très important. Cela montre que même pour un ajustement des raies d'énergie spectrale, la théorie de la perturbation échoue à traduire entièrement le phénomène.
Les modifications de formules induites par l'introduction de la perturbation ne sont pas exactes, mias peuvent conduire à des résultats précis tant que le paramètre de développement α reste faible. Au-delà d'un certain ordre n˜1 / α, cependant, les résultats deviennent divergents au fur et à mesure que les séries générées divergent, leur développement étant asymptotique. Il existe des manières de les convertir en séries convergentes, ce qui peut être considéré pour des paramètres de développement importants, en particulier par une méthode de perturbation variationnelle.
En électrodynamique quantique (QED) dans laquelle l'interaction électron-phonon est traitée de manière perturbative, le calcul du moment magnétique électronique est en accord avec l'expérience jusqu'à 11 décimales. Dans cette théorie, ainsi que pour d'autre théories quantiques des champs, des techniques spécifiques de calcul connues sous le nom de diagrammes de Feynman sont employées pour effectuer une somme systématique des termes de séries puissance.

Dans certaines circonstances, la théorie de la perturbation est une approche invalide. Cela se produit lorsque le système à décrire ne peut être approché par une petite perturbation imposée à un système simple. En chromodynamique quantique, par exemple, l'interaction des quarks avec le champ gluonique ne peut être traité par perturbation aux faibles énergies car la constante de couplage (paramètre de développement) devient trop important. La théorie de la perturbation échoue aussi à décrire des états générés de manière diabatique à partir du « modèle libre », comme les états liants et différents phénomènes collectifs comme les solitons. On peut considérer, par exemple, un système de particules libres (non-interagissantes), dans lequel une interaction attractive est introduite. Selon la forme de cette interaction, un ensemble entièrement nouveau d'états propres correspondant aux groupes de particules liées à d'autres peut être créé. Un exemple de ce phénomène peut être trouvé en supraconductivité conventionnelle, dans laquelle l'attraction portée par les phonons entre les électrons de conduction mène à la formation de paires d'électrons corrélés connues sous le nom de paires de Cooper. Lorsque l'on a à faire à de tels systèmes, on utilise habituellement d'autres schémas d'approximation, comme la méthode variationnelle ou l'approximation BKW. En effet, il n'existe pas d'analogue à une particule liante dans le modèle non perturbé et l'énergie d'un soliton varie typiquement comme l'inverse du paramètre de développement. Cependant, si l'on « intègre » sur le phénomène solitonique, les corrections non perturbatives seront dans ce cas faibles, de l'ordre de e − 1 / g ou e^{-1/g^2} dans le paramètre de perturbation g. La théorie de la perturbation peut seulement conduire à des solutions « proches » de la solution non-perturbée, même s'il existe d'autres solutions (qui augmentent typiquement quand le paramètre de développement approche de zéro).
Le traitement des problèmes des systèmes non-perturbatifs a été en partie aidé par l'essor des ordinateurs modernes. Il est devenu (relativement) simple de trouver des solutions non-perturbatives pour certains problèmes, par le biais de méthodes comme la théorie de la fonctionnelle de la densité. Ces avancées ont particulièrement profité à la chimie quantique. Les ordinateurs ont également été employés pour procéder à des calculs en théorie de la perturbation atteignant de très hauts niveaux de précision, nécessaires et importants en physique des particules pour obtenir des résultats théoriques comparables à l'expérience.

[modifier] Théorie de la perturbation indépendante du temps

Il y a deux catégories de théorie de la perturbation : indépendante du temps et dépendante du temps. Dans cette section, on traitera de la théorie de la perturbation indépendante du temps, dans laquelle le hamiltonien de perturbation est statique. La théorie de la perturbation indépendante du temps fut présentée dans un article[1] d'Erwin Schrödinger de 1926, peu après qu'il eut énoncé ses théories en mécanique ondulatoire. Dans cet article, Erwin Schrödinger faisait référence à un travail antérieur de lord Rayleigh[2] qui étudia les vibrations harmoniques d'une corde perturbée par des petites inhomogénéités. C'est pourquoi cette théorie de la perturbation est parfois appelée théorie de la perturbation de Rayleigh-Schrödinger.

[modifier] Corrections du premier ordre

On commence en utilisant un hamiltonien non perturbé H0, qui est aussi considéré comme indépendant du temps. Il possède des niveaux d'énergie et états propres connus, déterminés par l'équation de Schrödinger indépendante du temps :

 H_0 |n^{(0)}\rang = E_n^{(0)} |n^{(0)}\rang \quad,\quad n = 1, 2, 3, \cdots

Pour simplifier, on postule que les énergies sont discrètes. Les exposants (0) indiquent que ces quantités sont associées au système non perturbé.

On peut alors introduire une perturbation dans le hamiltonien. Soit V un hamiltonien représentant une petite perturbation physique, comme un potentiel énergétique produisant un champ externe (donc V est formellement un opérateur hermitique). Soit λ un paramètre sans dimension pouvant prendre pour valeur des valeurs allant continument de 0 (pas de perturbation) à 1 (perturbation totale). Le hamiltonien perturbé est :

H = H0 + λV.

Les niveaux d'énergie et états propres du hamiltonien perturbé sont de nouveau donnés par l'équation de Schrödinger :

 \left(H_0 + \lambda V \right) |n\rang = E_n |n\rang .

Le but est alors d'exprimer En et |n> en termes de niveaux d'énergie et d'états propres de l'ancien hamiltonien. Si la perturbation est suffisamment faible, on peut les écrire en séries entières de λ :

 E_n = E_n^{(0)} + \lambda E_n^{(1)} + \lambda^2 E_n^{(2)} + \cdots
 |n\rang = |n^{(0)}\rang + \lambda |n^{(1)}\rang + \lambda^2 |n^{(2)}\rang + \cdots

 E_n^{(k)} = \frac{1}{k!} \frac{d^k E_n}{d \lambda^k}

et

 |n^{(k)}\rang = \frac{1}{k!}\frac{d^k |n\rang }{d \lambda^k}.

Lorsque λ = 0, on réduit les équations aux valeurs non perturbées, qui sont les premiers termes de chaque série. Lorsque la perturbation est faible, les niveaux d'énergie et les états propres ne devraient pas beaucoup différer de leurs valeurs non perturbées, et les termes devraient rapidement devenir plus petits au fur et à mesure que l'ordre augmente.
Si l'on introduit ces séries dans l'équation de Schrödinger, on obtient :

\begin{matrix}
\left(H_0 + \lambda V \right) \left(|n^{(0)}\rang + \lambda |n^{(1)}\rang + \cdots \right) \qquad\qquad\qquad\qquad\\
\qquad\qquad\qquad= \left(E_n^{(0)} + \lambda E_n^{(1)} + \lambda^2 E_n^{(2)} + \cdots \right) \left(|n^{(0)}\rang + \lambda |n^{(1)}\rang + \cdots \right)
\end{matrix}

Le développement de cette équation et la comparaison des coefficients de chaque puissance de λ conduit à un système d'équations infini. L'équation d'ordre 0 est tout simplement l'équation de Schrödinger pour des systèmes non perturbés. L'équation au premier ordre est :

 H_0 |n^{(1)}\rang + V |n^{(0)}\rang = E_n^{(0)} |n^{(1)}\rang + E_n^{(1)} |n^{(0)}\rang

que l'on multiplie par <n(0)|. Le premier terme de gauche s'annule avec le premier terme de droite (le hamiltonien non perturbé est hermitien). Cela conduit à la modification énergétique du premier ordre :

 E_n^{(1)} = \langle n^{(0)} | V | n^{(0)} \rangle

C'est tout simplement l'espérance du hamiltonien de perturbation lorsque le système est dans l'état non perturbée. Ce résultat peut être interprété de la manière suivant : supposons qu'une perturbation soit appliquée, mais que l'on conserve le système dans l'état quantique |n(0)>, qui est un état quantique valide bien que ne correspondant plus à un état propre de l'énergie. La perturbation fait que l'énergie moyenne de cet état croît de <n(0)|V|n(0)>. Cependant la modification réelle de l'énergie est légèrement différente, car l'état propre perturbé n'est pas exactement le même que |n(0)>. Les modifications qui s'ensuivent sont données par les corrections du deuxième ordre et suivants de l'énergie.
Avant de calculer les corrections à l'état propre d'énergie, on doit définir la question de la normalisation. On peut supposer <n(0)|n(0)>=1, mais la théorie de la perturbation postule que : <n|n>=1. Il s'ensuit qu'au premier ordre en λ, on doit avoir <n(0)|n(1)>+<n(1)|n(0)>=0. Tant que la phase globale n'est pas déterminée en mécanique quantique, on peut postuler sans perte de sa généralité que <n(0)|n> est un réel pur. Ainsi, <n(0)|n(1)>=<n(1)|n(0)>, et on en déduit :

 \lang n^{(0)} | n^{(1)} \rang=0.

Afin d'obtenir la correction du premier ordre de l'état propre d'énergie, on entre l'expression de la correction énergétique de premier ordre dans le résultat indiquant les coefficients de premier ordre de λ montré ci-dessus. On utilise ensuite la résolution de l'identité,

 V|n^{(0)}\rangle = \Big( \sum_{k\ne n} |k^{(0)}\rangle\langle k^{(0)}| \Big) V|n^{(0)}\rangle  + \left(|n^{(0)}\rangle\, \langle n^{(0)}|\right)  V|n^{(0)}\rangle

= \sum_{k\ne n} |k^{(0)}\rangle\langle k^{(0)}| V|n^{(0)}\rangle  + E_n^{(1)} |n^{(0)}\rangle,

|k^{(0)}\rangle est le complément orthogonal de |n^{(0)}\rangle. Le résultat est :

 \left(E_n^{(0)} - H_0 \right) |n^{(1)}\rang = \sum_{k \ne n} |k^{(0)}\rang \langle k^{(0)}|V|n^{(0)} \rangle

Supposons pour le moment que le niveau d'énergie d'ordre zéro ne soit pas dégénéré, c'est-à-dire qu'il n'y ait pas d'état propre de H0 dans le complément orthogonal de |n^{(0)}\rangle d'énergie E_n^{(0)}. On multiplie alors par <k(0)|, ce qui donne :

 \left(E_n^{(0)} - E_k^{(0)}  \right) \langle k^{(0)}|n^{(1)}\rang =  \langle k^{(0)}|V|n^{(0)} \rangle

et par conséquent le composant de la correction de premier ordre selon |k(0)> par le postulat  E_n^{(0)} \ne E_k^{(0)}. Nous avons au total :

 |n^{(1)}\rang = \sum_{k \ne n} \frac{\langle k^{(0)}|V|n^{(0)} \rangle}{E_n^{(0)} - E_k^{(0)}} |k^{(0)}\rang

La modification de premier ordre dans le Nième ket propre de l'énergie possède une contribution des états propres de l'énergie k ≠ n. Chaque terme est proportionnel à l'élément de matrice <k(0)|V|n(0)>, qui est une mesure de combien la perturbation mélange l'état propre n avec l'état propre k ; il est également inversement proportionnel à la différence d'énergie entre les états propres k et n, ce qui signifie que la perturbation « déforme » l'état propre vers un développement plus important si il existe plus d'états propres à des énergies proches. On voit aussi que l'expression est singulière si chacun de ces états possède la même énergie que l'état n, qui est ce pourquoi l'on postule la non-dégénérescence.

[modifier] Corrections du deuxième ordre et suivants

On peut trouver les déviations d'ordres supérieurs par une méthode similaire, bien que les calculs deviennent plus compliqués avec la formulation employée. La condition de normalisation indique que : 2<n(0)|n(2)>+<n(1)|n(1)>=0. Jusqu'au deuxième ordre, les expressions pour les énergies et les états propres (normalisés) sont :

E_n = E_n^{(0)} + \langle n^{(0)} | V | n^{(0)} \rangle + \sum_{k \ne n} \frac{|\langle k^{(0)}|V|n^{(0)} \rangle|^2} {E_n^{(0)} - E_k^{(0)}} + \cdots
|n\rangle = |n^{(0)}\rangle + \sum_{k \ne n} |k^{(0)}\rangle\frac{\langle k^{(0)}|V|n^{(0)}\rangle}{E_n^{(0)}-E_k^{(0)}} + \sum_{k\neq n}\sum_{\ell \neq n} |k^{(0)}\rangle\frac{\langle k^{(0)}|V|\ell^{(0)}\rangle\langle \ell^{(0)}|V|n^{(0)}\rangle}{(E_n^{(0)}-E_k^{(0)})(E_n^{(0)}-E_\ell^{(0)})} -
\sum_{k\neq n}|k^{(0)}\rangle\frac{\langle n^{(0)}|V|n^{(0)}\rangle\langle k^{(0)}|V|n^{(0)}\rangle}{(E_n^{(0)}-E_k^{(0)})^2} - \frac{1}{2} \sum_{k \ne n} |n^{(0)}\rangle\frac{\langle n^{(0)}|V|k^{(0)}\rangle \langle k^{(0)}|V|n^{(0)}\rangle }{(E_k^{(0)}-E_n^{(0)})^2} + \cdots

En étendant la méthode précédente, la correction d'énergie du troisième ordre peut être démontrée comme étant[3]

E_n^{(3)} = \sum_{k \neq n} \sum_{m \neq n} \frac{\langle n^{(0)} | V | m^{(0)} \rangle \langle m^{(0)} | V | k^{(0)} \rangle \langle k^{(0)} | V | n^{(0)} \rangle}{\left( E_m^{(0)} - E_n^{(0)} \right) \left( E_k^{(0)} - E_n^{(0)} \right)} - \langle n^{(0)} | V | n^{(0)} \rangle \sum_m \frac{|\langle n^{(0)} | V | m^{(0)} \rangle|^2}{\left( E_m^{(0)} - E_n^{(0)} \right)^2}

[modifier] Effets de la dégénérescence

On suppose que deux ou plus états propres d'énergie sont dégénérés. Les calculs précédents pour les modifications d'énergie du premier ordre ne sont pas affectés, mais le calcul de la modification de l'état propre est problématique car l'opérateur

 E_n^{(0)} - H_0

n'a pas d'inverse bien défini.
Cela relève d'un problème conceptuel plutôt que mathématique. Imaginons que l'on ait deux ou plus états propres perturbés avec différentes énergies, continument générés à partir d'un nombre égal d'états propres non perturbés dégénérés. Soit D le sous-espace occupé par ces états propres dégénérés. Le problème repose sur le fait qu'il n'y a pas de méthode unique pour choisir une base d'états propres de l'énergie pour un système non perturbé. En particulier, on peut construire une base différente pour D en choisissant différentes combinaisons linéaires des états propres le constituant. Dans une telle base, les états propres non perturbés ne génèreraient pas continument les états propres perturbés.

On voit ainsi que, en présence d'une dégénérescence, la théorie de la perturbation ne fonctionne pas avec un choix de base arbitraire. On doit plutôt choisir une base telle que le hamiltonien de perturbation soit diagonal dans le sous-espace dégénéré D. En d'autres termes,

V |k^{(0)}\rangle = \epsilon_k |k^{(0)}\rangle + \mbox{(termes hors de }D) \qquad \forall \; |k^{(0)}\rangle \in D.

Dans ce cas, l'équation pour la perturbation de premier ordre dans l'état propre d'énergie se réduit à :

 \left(E_n^{(0)} - H_0 \right) |n^{(1)}\rang = \sum_{k \not\in D} \left(\langle k^{(0)}|V|n^{(0)} \rangle \right) |k^{(0)}\rang.

L'opérateur de gauche n'est pas singulier lorsqu'il est appliqué aux états propres n'appartenant pas à D, on peut alors écrire

 |n^{(1)}\rang = \sum_{k \not\in D} \frac{\langle k^{(0)}|V|n^{(0)} \rangle}{E_n^{(0)} - E_k^{(0)}} |k^{(0)}\rang.

[modifier] Théorie de la perturbation dépendante du temps

La théorie de la perturbation dépendante du temps, développée par Paul Dirac, traite de l'effet d'une perturbation V(t) dépendante du temps appliquée à un hamiltonien H0 indépendant du temps. Le hamiltonien perturbé étant dépendant du temps, ses niveaux et états propres d'énergie le sont aussi. Par conséquent, les objectifs de la théorie de la perturbation dépendante du temps sont légèrement différents de ceux la théorie de la perturbation indépendante du temps. On traite les quantités suivantes :

  • l'espérance mathématique dépendante du temps d'une observable A, pour un état initial donné.
  • les amplitudes dépendantes du temps des états quantiques étant des kets propres (vecteurs propres) de l'énergie dans le système non perturbé.

La première quantité est importante car elle est à l'origine du résultat classique d'une mesure de A réalisée sur un nombre macroscopique d'exemplaires du système perturbé. Par exemple, on peut prendre A comme le déplacement dans la direction x de l'électron dans un atome d'hydrogène, dans le cas duquel l'espérance mathématique, lorsqu'elle est multipliée par un coefficient approprié, donne la polarisation électrique dépendante du temps du gaz d'hydrogène. Avec un choix approprié de perturbation (comme par exemple un potentiel électrique oscillant), cela permet de calculer la permittivité diélectrique du gaz.
La seconde concerne la probabilité temporelle d'occupation de chaque état propre. Cela est particulièrement utile en physique des lasers, dans laquelle on s'intéresse à des populations dans différents états atomiques dans un gaz lorsqu'un champ électrique variable dans le temps est appliqué. Ces probabilités sont aussi utiles pour calculer l'élargissement quantique des raies spectrales.

On exposera brièvement ci-après les idées de la formulation de Dirac de la théorie de la perturbation dépendante du temps. Choisissons une base d'énergie {|n>} pour le système non perturbé. On ne portera plus les exposants (0) pour les états propres, parler de niveaux d'énergie et d'états propres pour le système perturbé étant peu significatif.

Si le système non perturbé est un état propre |j> au temps t = 0, son état aux temps suivants varie seulement d'une phase (on se place dans la représentation de Schrödinger, où les vecteurs d'état évoluent dans le temps et les opérateurs constants) :

 |j(t)\rang = e^{-iE_j t /\hbar} |j\rang

On introduit alors un hamiltonien perturbé dépendant du temps V(t). Le hamiltonien du système perturbé est :

H = H0 + V(t)

Soit |ψ(t)> la notation pour l'état quantique du système perturbé au temps t. Il obéit à l'équation de Schrödinger dépendante du temps,

 H |\psi(t)\rang = i\hbar \frac{\partial}{\partial t} |\psi(t)\rang

L'état quantique à chaque instant peut être exprimé comme une combinaison linéaire de la base propre {|n>}. On peut écrire la combinaison linéaire comme étant :

 |\psi(t)\rang = \sum_n c_n(t) e^{- i E_n t / \hbar} |n\rang

où les cn(t) sont des fonctions complexes non déterminées de t que nous appellerons amplitudes (à strictement parler, ce sont les amplitudes dans la représentation de Dirac). On a explicitement extrait les facteurs de phase exponentielle exp(-iEnt/h) du côté droit de l'équation. Cela est simplement un problème de convention, et peut être produit sans perte de la généralité. La raison pour laquelle on s'intéresse à ce problème est que quand le système débute dans l'état |j> et qu'il n'y a pas de perturbation, les amplitudes ont la propriété intéressante que, pour tout t, cj(t) = 1 et cn(t) = 0 si n≠j.

Le carré de la valeur absolue de l'amplitude cn(t) est la probabilité que le système soit dans l'état n au temps t :

 \left|c_n(t)\right|^2 = \left|\lang n|\psi(t)\rang\right|^2

Inséré dans l'équation de Schrödinger, et considérant ∂/∂t par dérivation des fonctions composées, on obtient :

 \sum_n \left( i\hbar \frac{\partial c_n}{\partial t} - c_n(t) V(t) \right) e^{- i E_n t /\hbar} |n\rang = 0

En résolvant l'identité devant V, on peut réduire cette équation en un ensemble d'équations aux dérivées partielles pour les amplitudes :

 \frac{\partial c_n}{\partial t} = \frac{-i}{\hbar} \sum_k \lang n|V(t)|k\rang \,c_k(t)\, e^{-i(E_k - E_n)t/\hbar}

Les éléments de matrice de V jouent un rôle similaire à celui tenu dans la théorie de la perturbation indépendante du temps, étant proportionnels au taux auquel les amplitudes sont modifiées entre les états. Il faut noter, cependant, que la direction de la modification est conditionnée par le facteur de phase exponentiel. Sur des temps bien plus importants que ceux correspondant à la différence d'énergie Ek-En, la phase peut cycler plusieurs fois. Si la dépendance en temps de V est suffisamment faible, cela peut provoquer une oscillation des amplitudes d'état. De telles oscillations sont utilisées pour gérer les transitions radiatives dans les lasers.
Jusque là, on n'a fait aucune approximation, donc l'ensemble d'équations différentielles est exact. En indiquant des valeurs initiales appropriées cn(0), on peut en principe trouver une solution exacte (non perturbative). Cela est facilement trouvé lorsqu'il y a seulement deux niveaux d'énergie (n= 1, 2), et la solution est utile pour des systèmes modèles comme la molécule d'ammoniaque. Cependant, il est difficile de trouver des solutions exactes lorsqu'il y a plusieurs niveaux d'énergie, et l'on cherchera plutôt des solutions perturbatives, qui peuvent être obtenues en mettant les équations sous une forme intégrale :

 c_n(t) = c_n(0) + \frac{-i}{\hbar} \sum_k \int_0^t dt' \;\lang n|V(t')|k\rang \,c_k(t')\, e^{-i(E_k - E_n)t'/\hbar}

On effectuant de manière répétée la substitution pour chaque cn du côté droit, on obtient la solution itérative :

c_n(t) = c_n^{(0)} + c_n^{(1)} + c_n^{(2)} + \cdots

où, par exemple, le terme de premier ordre est :

c_n^{(1)}(t) = \frac{-i}{\hbar} \sum_k \int_0^t dt' \;\lang n|V(t')|k\rang \, c_k(0) \, e^{-i(E_k - E_n)t'/\hbar}

De nombreux résultats induits peuvent être obtenus, comme la règle d'or de Fermi, qui lie le taux de transition entre états quantiques à la densité d'états à énergies particulières, et les séries de Dyson, obtenues en appliquant la méthode itérative à l'opérateur d'évolution temporelle, qui est l'un des points de départ de la méthode des diagrammes de Feynman. La Théorie de la perturbation de Møller-Plesset est une application de la théorie de la perturbation à la méthode Hartree-Fock.

[modifier] Voir aussi

[modifier] Références

  1. E. Schrödinger, Annalen der Physik, Vierte Folge, Band 80, p. 437 (1926)
  2. J. W. S. Rayleigh, Theory of Sound, 2nd edition Vol. I, pp 115-118, Macmillan, London (1894)
  3. (en) L. D. Landau, E. M. Lifschitz, ``Quantum Mechanics: Non-relativistic Theory", 3e ed.

[modifier] Bibliographie