Principe de moindre action

Un article de Wikipédia, l'encyclopédie libre.

Joseph-Louis Lagrange est le premier a définir mathématiquement le principe de moindre action.
Joseph-Louis Lagrange est le premier a définir mathématiquement le principe de moindre action.
Effet Meissner
Cet article est lié au
Portail Sciences
Sciences de la nature
Sciences humaines et sociales
Sciences formelles
Études sur la science
Cette boîte: voir • disc. • mod.

En physique, le principe de moindre action est l'hypothèse selon laquelle la dynamique d'une quantité physique (la position, la vitesse et l'accélération d'une particule, ou les valeurs d'un champ en tout point de l'espace, et leurs variations) peut se déduire à partir d'une unique grandeur appelée action, dépendant de la quantité physique considérée, et en supposant que les valeurs dynamiques permettent à l'action d'avoir une valeur minimale entre deux instants donnés.

La plupart des équations fondamentales de la physique peuvent être formulées à partir du principe de moindre action. C'est notamment le cas en mécanique classique, en électromagnétisme, en relativité générale et en théorie quantique des champs.

Sommaire

[modifier] Formulation historique

Dans Principe de la moindre quantité d'action pour la mécanique (1744), Maupertuis définit l'action comme suit :

« L'Action est proportionnelle au produit de la masse par la vitesse et par l'espace. Maintenant, voici ce principe, si sage, si digne de l'Être suprême : lorsqu'il arrive quelque changement dans la Nature, la quantité d'Action employée pour ce changement est toujours la plus petite qu'il soit possible. »

Fermat, König et Leibniz avaient avancé le même principe sous le nom de « principe d’économie naturelle »[1]; lequel deviendra le principe de conservation de l’énergie avec les travaux d’Euler, de Lagrange, de Jacobi et de Helmholtz.

[modifier] Vulgarisation et interprétations

[modifier] Résumé anthropomorphique

Le principe de moindre action dit qu'en mécanique un corps prend la direction qui lui permet de dépenser le moins d'énergie dans l'immédiat (ou d'acquérir le plus d'énergie dans l'immédiat), en tenant compte qu'il doit y avoir continuité du mouvement (positions et vitesses) s'il y a continuité des conditions physiques.[2]

Il est à remarquer qu'en reliant deux points, la trajectoire prise par le corps n'est pas toujours celle qui lui fait dépenser globalement le moins d'énergie car c'est la dépense immédiate d'énergie qui est minimisée (comme si le corps ne percevait que les conditions de son environnement immédiat) et si le chemin parcouru est long, un chemin plus court avec une dépense d'énergie immédiate plus élevée peut permettre une dépense globale inférieure. Une analogie avec la consommation en carburant d'une voiture peut être faite.

Note : dans ce « résumé », énergie signifie énergie cinétique.

[modifier] Méthode et interprétation en physique classique

L'action se présente comme la sommation, le long du parcours du système, de la différence entre l'énergie cinétique et l'énergie potentielle. La minimisation se fait par une méthode variationnelle : à points extremum fixés, temps de trajet fixé, et trajet variable, on cherche les conditions imposées au trajet pour qu'il minimise l'action.

On peut interpréter cela comme équivalent aux deux conditions suivantes:

  • La trajectoire que suit un corps est celle qui permet la transformation instantanée de l'énergie cinétique en énergie potentielle la plus petite possible (donc aussi la plus lente sur la trajectoire), ou la transformation immédiate dans le sens inverse la plus grande possible (donc la plus rapide possible sur la trajectoire).
  • La transformation (et donc la trajectoire) est déterminée par les conditions initiales (position et vitesse) et les conditions de l'environnement physique : il doit y avoir continuité de la trajectoire s'il y a continuité du milieu physique.

Il y a parfois un échange cyclique entre ces deux énergies (balancier sans frottement, satellite à orbite elliptique,...) ou une stabilisation provisoire (bille immobile ou posée au fond d'un trou, satellite à orbite circulaire,...).

La chute libre d'un corps est l'exemple type de la transformation de l'énergie potentielle (gravitationnelle) en énergie cinétique. Le ralentissement et l'arrêt (avant sa chute) d'un corps lancé verticalement est un exemple de la transformation inverse.

Les frottements imposent une transformation plus compliquée car ils engendrent de la chaleur, qui est l'énergie cinétique des molécules des matériaux, mais en négligeant cette forme d'énergie, on peut utiliser le Principe de moindre action en considérant que de l'énergie cinétique se perd (sort du système étudié).

[modifier] Un problème métaphysique ?

Le principe de moindre action utilise l'hypothèse de deux points fixes sur le parcours du mobile : un point de départ, mais aussi un point d'arrivée. Cela a souvent été critiqué comme étant l'utilisation dans le raisonnement d'une « cause finale », ce qui est contraire à la causalité qui suit la flèche du temps en physique.

En fait, si le point de départ est doté de conditions initiales (coordonnées et vitesse), le point d'arrivée n'a pas de coordonnées précises ni de vitesse imposée : il existe, c'est tout. L'existence du point final dans le raisonnement permet d'émettre l'hypothèse de l'existence d'un trajet à partir de l'état initial et de déterminer ses conditions (équations d'Euler-Lagrange), mais n'impose aucune autre condition en dehors de la continuité indiquée plus haut (ce travail peut même montrer que seul un trajet de longueur nulle est possible dans les cas de stabilité du mobile).

[modifier] Un principe démontré

Avant Lagrange ce principe se concevait à partir de considérations métaphysiques, indépendamment de tout autre principe physique.

Lagrange, en 1756, fut celui qui donna au Principe de moindre action son expression mathématique efficace qui est toujours d'actualité. Il fut aussi celui qui développa la mécanique analytique et démontra, dans son ouvrage de 1788, ce principe à partir de la conservation de l'énergie et du principe des vitesses virtuelles (nommé aussi principe de d'Alembert). Le principe des vitesses virtuelles est le principe fondamental de la dynamique de Newton exprimé dans le langage de l'analyse mathématique, alors balbutiante au regard de ses développements ultérieurs.

Cette démonstration met un point final aux interrogations métaphysiques sur le principe de moindre action : le principe est équivalent à un principe physique de Newton, non sujet aux critiques métaphysiques. Mais cette conclusion est souvent oubliée, et dans ce cas l'artifice mathématique de la « cause finale » est discuté comme étant problématique.

[modifier] De l'action classique à l'action relativiste

Suivant le système étudié, et le cadre théorique dans lequel on le considère, l'expression mathématique du principe de moindre action change légèrement de forme.

C'est un des rares principes ayant survécu aux multiples mutations de la physique, mais il a rarement été à l'origine d'une découverte : il est plutôt utilisé pour reformuler ou redémontrer des lois trouvées par d'autres biais. Sa plus grande contribution a sans doute été de mettre W. R. Hamilton sur la voie de ses travaux théoriques (voir: Mécanique hamiltonienne).

En physique relativiste, les équations d'Euler-Lagrange restent inchangées, mais le lagrangien n'est plus égal à la différence entre l'énergie cinétique et l'énergie potentielle. En fait, à partir de la relativité il est apparu que le principe de moindre action se base sur l'existence d'une trajectoire continue, paramétrée par le temps, qui minimise une fonction ou la différence entre des fonctions du système étudié, déterminées à partir de principes généraux, tels que par exemples :

  • Comme la trajectoire dans l'espace-temps ne dépend pas du repère d'où on l'observe, l'action qui la détermine, ainsi que les fonctions qui composent l'action, sont invariantes par changement de repère.
  • L'indépendance de corps implique l'additivité de leurs actions et de leurs lagrangiens, pour que les trajectoires puissent être déterminées séparément en appliquant la méthode variationnelle.

Il se trouve qu'en physique classique, ces fonctions du système sont les énergies cinétiques et potentielles, ce n'est plus le cas en relativité.

En physique relativiste, et en l'absence de champ électromagnétique, on montre que la fonction du corps qui est minimisée dans le principe est particulièrement simple : il s'agit de mcτ, où τ est « temps propre » du trajet, qui est à la fois le temps s'écoulant dans le référentiel du corps au cours du trajet et la longueur de la trajectoire mesurée par la métrique de l'espace : cela revient à maximiser le « temps propre », du fait du signe et de la constance de la masse m et de la vitesse de la lumière c.
Un champ électromagnétique amène des différences de parcours entre les corps, suivant leurs charges et leurs répartitions.
Et comme en physique classique, toutes les équations peuvent être obtenues sans le principe de moindre action.

[modifier] Sa formulation en mécanique quantique

Dans le but de trouver une formulation plus simple de l'électrodynamique quantique, vers 1940, Richard Feynman chercha une formulation du principe de moindre action en mécanique quantique. La solution lui vint d'une idée que Paul Dirac avait exprimée dans un article[3].
Le principe a ainsi permis une reformulation de cette branche de la physique sous forme d'intégrale de chemin qui s'est révélé, en effet, plus simple que la formulation hamiltonnienne pour l'électrodynamique quantique.
Cette formulation a donné lieu à des interprétations telle que « la particule teste tous les chemins possibles avec des probabilités différentes ».[4]

Comme on peut s'y attendre, la formulation quantique permet de retrouver, à la limite classique, la formulation habituelle et le chemin qui rend extrémale l'action classique est un col de l'intégrale : seul celui ci contribue de manière significative dans l'intégrale.

Icône de détail Article détaillé : Intégrale de chemin.

[modifier] Court historique[5]

En 1916, David Hilbert a redémontré les équations de la gravitation de la relativité générale à l'aide du principe de moindre action.(Photo prise en 1912.)
En 1916, David Hilbert a redémontré les équations de la gravitation de la relativité générale à l'aide du principe de moindre action.
(Photo prise en 1912.)

L'idée que la trajectoire minimise une durée ou une longueur est d'abord née chez Pierre de Fermat vers 1655 pendant son étude de l'optique (voir Principe de Fermat). Même si elle a interessé Leibnitz et Newton, c'est Maupertuis, vers 1740, qui fera progresser la formulation verbale et mathématique d'un « principe de moindre action » pour la mécanique. Euler, en développant l'analyse mathématique, commença à reformuler ce principe, mais c'est Lagrange qui lui donnera sa méthode et sa forme définitive en 1755, pour ensuite l'inclure comme une simple conséquence de sa mécanique analytique.

En 1827, Hamilton, en cherchant à appliquer ce principe à l'optique, développa une nouvelle approche basée sur l'étude de l'énergie par la méthode analytique : la mécanique hamiltonienne, que Jacobi peaufinera vers 1840.

Depuis sa formulation, ce principe a guidé de nombreux scientifiques dans leurs recherches, notamment de Broglie vers 1920 dans son travail sur la théorie des quanta. En 1916, Hilbert a redémontré les équations de la gravitation de la relativité générale à l'aide du principe, et Richard Feynman, en 1942, a proposé une nouvelle formulation du principe dans sa thèse de doctorat intitulée Le Principe de moindre action en mécanique quantique, permettant une réécriture de la mécanique quantique.

[modifier] En mécanique classique

[modifier] Une alternative de présentation

  • Soit on expose l'action et le lagrangien habituels de la physique classique (non relativiste), puis on détermine les équations d'Euler-Lagrange.
  • Soit on définit abstraitement l'action et le lagrangien (à la manière de Landau et Lifchitz[6]), et on détermine leurs formes et leurs propriétés qu'imposent les principes de la physique, ainsi que les équations d'Euler-Lagrange.

Dans cet article, seule la première présentation sera donnée.

[modifier] Définition du lagrangien et de l'action classiques

Considérons pour simplifier un point matériel décrit, dans un repère galiléen, par un seul degré de liberté, noté q(t) à l'instant t [7]. Le lagrangien est la différence entre l'énergie cinétique (du point matériel) et l'énergie potentielle (due à l'environnement physique) :

 L(q,\dot{q},t) \ = \ \frac{1}{2} \,  m \, \dot{q}^2 \ - \ V(q,\dot{q},t)\

\frac{1}{2} \,  m \, \dot{q}^2 est l'énergie cinétique du système et  \ V(q,\dot{q},t) est l'énergie potentielle, qui en général ne dépend pas de \dot{q}.

L'action de la trajectoire, étant la somme totale de la différence entre l'énergie cinétique et l'énergie potentielle durant la trajectoire, est définie par:

S \ = \ \int_{t_i}^{t_f} L(q(t),\dot{q}(t),t)\ dt

ti et tf désignent respectivement l'instant initial et l'instant final.

[modifier] Les équations d'Euler-Lagrange

  • Dire que le chemin « minimise localement l'action » signifie que pour tout autre chemin ayant les mêmes conditions initiales et finales, et suffisamment proche du chemin minimisant, la valeur de l'action est plus grande.
  • Avec certaines conditions initiales et/ou finales, le chemin minimisant localement l'action peut ne pas exister, mais s'il existe, il est unique (à cause des conditions initiales et de la continuité du mouvement).

Le lagrangien n'est pas défini de manière unique : l'ajout au lagrangien d'une fonction f(q,\dot{q},t) = \frac{dF}{dt} ajoute à l'action une fonction \ F(t_{final}) - F(t_{initial}) qui ne dépend que des extrémités et qui s'annule quand on fait varier l'action par rapport au chemin.

Le chemin q(t) effectivement suivi par le point matériel entre les instants ti et tf fixés est un extremum de l'action (car il lui fait atteindre sa valeur minimale), donc en faisant une variation du chemin, on a :

 \delta S[q]  \ = \ 0

Les équations (d'Euler-Lagrange) que l'on en déduit sont:

\frac{d~~ }{dt} \frac{\partial L}{\partial \dot{q}}(q, \dot{q},t) \ -  \  \frac{\partial L}{\partial q}(q, \dot{q},t)  \ = \ 0


[modifier] L'équation fondamentale de la dynamique newtonienne

Supposons que \ V(q,\dot{q},t) = V(q,t) .

Avec l'expression du lagrangien classique, on obtient: \frac{d~~ }{dt} \frac{\partial L}{\partial \dot{q}}(q, \dot{q},t) \ = \ m.\ddot{q}

Les équations d'Euler-lagrange donnent:

 m.\ddot{q} =  - \frac{\partial V}{\partial q}(q_0,t)

Ce qui exprime les lois du mouvement de Newton avec:

(Somme des forces extérieures) =  - \frac{\partial V}{\partial q}(q_0,t)

Si toutes les forces en jeu dérivent d'un potentiel, le principe de moindre action peut être considéré comme une réécriture des lois du mouvement de Newton.

[modifier] Cas où il y a des forces de frottements

On suppose que le système évolue dans un milieu homogène (mêmes propriétés à tous les endroits) et isotrope (mêmes propriétés dans toutes les directions), et dont la viscosité engendre des frottements :

  • S'il n'y a qu'un seul degré de liberté  \ q du système :
En première approximation, les forces de frottements peuvent se modéliser par  \ f = -\ a.\dot{q}  \ a est une constante positive dépendant des caractéristiques géométriques du corps et de la viscosité du milieu (air, eau, ...), le signe \ - indiquant que les frottements sont orientés dans le sens inverse du mouvement.
On peut donc utiliser le potentiel  \ V_{\ fr} = \frac{a}{2}.(\dot{q})^2 dans le lagrangien.
  • S'il y a plusieurs degrés de liberté, le lagrangien s'écrit  L(q,\dot{q},t) \ = \frac{1}{2} \Sigma_i \,  m_i \, \dot{q}_{i}^2 \ - \ V(q,\dot{q},t)\
Et la force de frottement dans la direction de la j-ième coordonnée est  \ f_{j} = -\Sigma_i \ a_{i,j}.\dot{q}_i
Ce qui est une égalité scalaire, où les  \ a_{i,j} sont des constantes, ainsi que dans le cas précédent.
Il n'y a de potentiel que si  \ a_{i,j} = a_{j,i} , ce qui est toujours vrai dans un fluide homogène et isotrope.
Dans le cas où il y a un potentiel (appelé fonction de dissipation), il a la forme d'une fonction quadratique :  \ F = \frac{1}{2} \Sigma_{ij} \ a_{i,j}.\dot{q}_i \dot{q}_j
On vérifie facilement que :  \ f_{j} = - \frac{\partial F}{\partial \dot{q}_j}
Dans tous les cas, pour préserver l'utilisation du lagrangien, et pour respecter l'équation fondamentale de la dynamique, on écrit :
\frac{d~~ }{dt} \frac{\partial L}{\partial \dot{q}_j}(q, \dot{q},t) \ -  \  \frac{\partial L}{\partial q_j}(q, \dot{q},t)  \ =\ f_{j} = -\Sigma_i \ a_{i,j}.\dot{q}_i

Si la fonction de dissipation  \ F est utilisable, on démontre que  \frac{dE}{dt} = -2F (voir plus bas pour la définition de l'énergie E), ainsi cette fonction quantifie la dissipation d'énergie du système au cours du temps.

Pour une vue plus exhaustive sur les frottements, consulter le wikilivre Tribologie

[modifier] Particule chargée dans un champ électromagnétique

Ici \; e est la charge de la particule.

 L = L(\vec{q},\dot{\vec{q}},t)  =  \frac{1}{2}m \ \dot{\vec{q}}^2 \ - \ V(q,\dot{\vec{q}},t)\

avec :  \ V(q,\dot{\vec{q}},t)= e\phi(\vec{q},t) - e \dot{\vec{q}}. \vec{A}(\vec{q},t) ; la donnée  \left(\phi(\vec{q},t), \vec{A}(\vec{q},t)\right) est appelée « potentiel électromagnétique ».

Donc :

 L = {1 \over 2} m \dot{\vec{q}}^2  - e\phi + e. \dot{\vec{q}} \cdot \vec{A}

En posant  \vec{E} = - \frac{\partial \vec{A}}{\partial t} - \vec{grad} \phi le champ électrique et  \vec{B} = \vec{rot} \vec{A} le champ magnétique.

Les équations d'Euler-Lagrange donnent :

 m \ddot{\vec{q}~}= e \left(\vec{E} + \dot{\vec{q}~} \wedge \vec{B}\right)

 \vec{F} = e \left(\vec{E} + \dot{\vec{q}} \wedge \vec{B}\right) est appelé force de Lorentz.

Historiquement, la force de Lorentz a été trouvée avant l'idée du potentiel électromagnétique.

[modifier] L'impulsion

L'impulsion est la variable conjuguée de la vitesse dans la transformée de Legendre du lagrangien.

Elle est définie par :  p = \frac{\partial L}{\partial \dot{q}}(q, \dot{q},t)

  • Si  \ V = V(q,t) alors  p = m \dot{q}
Donc  \dot{q} = \frac{1}{m} p , d'où :  L = L(q,p,t)  =  \frac{1}{2m} \ p^2 \ - \ V(q,t)\
  • Si  \ V = V(q,\dot{q},t) est affine par rapport à  \dot{q} (sinon il s'agit d'une force de frottement) alors  p = m \dot{q} - \frac{\partial V}{\partial \dot{q}}
\frac{\partial V}{\partial \dot{q}} est indépendant de  \dot{q} .
L'impulsion est utilisable comme variable :
En remarquant que:  \dot{q} = \frac{1}{m} \left( p + \frac{\partial V}{\partial \dot{q}}\right) , on a  L = L(q,p,t)  =  \frac{1}{2m} \ \left( p + \frac{\partial V}{\partial \dot{q}}\right)^2 \ - \ V(q,p,t)\
En développant le carré, on obtient:
 L = L(q,p,t)  =  \frac{1}{2m} \ p^2 \ - \ V'(q,t)\

Dans le lagrangien  \ L(q,p,t) , le potentiel est indépendant de  \ p .

Avec l'impulsion comme variable, les équations d'Euler-Lagrange ne changent pas de forme :  \ p y prend la place de  \dot{q} .

[modifier] Invariances et constantes du mouvement

Le théorème de Noether montre qu'une invariance du lagrangien par une transformation impose une grandeur invariante du système. On peut utiliser l'énergie du système pour arriver aux mêmes invariants (mis à part le premier cas).

[modifier] Indépendance par rapport au temps

Si les forces en présence sont indépendantes du temps ou si le système est fermé, alors le lagrangien ne dépend pas explicitement du temps :  \frac{\partial L}{\partial t } = 0 ou encore  L = L(\vec{q}, \dot{\vec{q}~})

En dérivant le lagrangien par rapport au temps, on démontre que l'énergie totale

 E = \frac{\partial L}{\partial \dot{\vec{q}~}} .\dot{\vec{q}~} - L = \frac{1}{2} \,  m \, \dot{\vec{q}~}^2  +  V\left(\vec{q}\right)
est constante par rapport au temps.
C’est-à-dire : \frac{dE }{dt} = 0

Ceci peut se démontrer directement à partir de l'équation fondamentale de la dynamique.

L'énergie du système peut aussi être définie comme la transformée de Legendre du lagrangien.

Dans le cas particulier où il s'agit d'un potentiel électromagnétique, et en utilisant les notations vues ci-dessus pour ce cas, on montre que : E = \frac{1}{2m}.\left(\vec{p} - e.\vec{A}\right)^2 + e.\phi

[modifier] Translation dans l'espace

Pour un système fermé, et du fait de l'homogénéité (mêmes propriétés à des endroits différents) de l'espace, une translation du système de vecteur constant n'en change pas les propriétés, et donc ne change pas le lagrangien.

On en tire la conclusion de l'invariance de l'impulsion du système. Cette impulsion est la somme des impulsions des éléments du système.

[modifier] Rotation dans l'espace

Pour un système fermé, et du fait de l'isotropie de l'espace (mêmes propriétés dans des directions différentes) de l'espace, une rotation fixée du système n'en change pas les propriétés, et donc ne change pas le lagrangien.

On en tire la conclusion de l'invariance du moment cinétique du système. Ce moment cinétique est la somme des moments cinétiques des éléments du système.

[modifier] Changement de repère galiléen

Un changement de repère galiléen ne change pas les propriétés du système, par contre il permet de montrer qu'il existe un centre de masse (ou centre d'inertie) du système : particule virtuelle dont la masse est la masse totale du système, et animée d'un mouvement rectiligne uniforme en cas d'absence d'interaction avec l'extérieur.

Dans ce dernier cas, en posant

  •  \mu \ = masse totale
  •  \ V = vitesse du centre de masse
  • énergie interne :  \ E_{int} = \Sigma_{i} \ m_{i} \ v_{i}^2 + U
  • lagrangien interne :  \ L_{int} = \Sigma_{i} \ m_{i} \ v_{i}^2 - U
avec  \ v_{i} = vitesse relative du ième corps par rapport au centre de masse
et  \ U = énergie potentielle d'interactions entre les corps du système.

Le lagrangien du système peut s'écrire :  \ L = \frac{\mu \ V^2}{2} + \ L_{int}

et l'énergie  \ E = \frac{\mu \ V^2}{2} + \ E_{int}

Le référentiel à privilégier pour faciliter les calculs est le référentiel du centre de masse dont l'impulsion et le moment cinétique sont ceux vus ci-dessus.

[modifier] Changement de jauge

La jauge est l'ensemble des unités de mesures utilisées pour mesurer les différentes caractéristiques du système. Un changement de jauge qui ne change le lagrangien que d'un facteur multiplicatif constant permet de montrer facilement certaines propriétés quand l'énergie potentielle est une fonction homogène des coordonnées (ce qui est souvent le cas).

Plus précisément : supposons que  \ U(a.q_1,a.q_2,....,a.q_n) = a^k.U(q_1,q_2,...,q_n)

Un changement global de jauge est un changement de mesures :  \ q \to a.q et  \ t \to b.t

Ce qui signifie que :  \frac{q}{q'} = a et  \frac{t}{t'} = b \ q , \ q' d'une part, et \ t et \ t' de l'autre, sont des mesures différentes des mêmes distances physiques ou temporelles.

Alors  v = \frac{dq}{dt} subit le changement de mesure \ v \to \frac{a}{b}.v , donc l'énergie cinétique subit un changement de mesures de facteur  \frac{a^2}{b^2}

Pour que le lagrangien ne soit que multiplié par un nombre constant, il faut que :  \frac{a^2}{b^2} = a^k , c'est-à-dire :  \ b = a^{1-\frac{k}{2}}

[modifier] En relativité restreinte

Le lecteur doit prendre garde que dans cette partie, et celle concernant la relativité générale, on n'étudie que le potentiel du champ électromagnétique, et la lettre \ V désigne une vitesse, ainsi qu'indiqué ci-dessous.

[modifier] Avec ou sans quadri-écriture

  • En relativité restreinte, les corps évoluent dans l'espace-temps de Minkowski où chaque référentiel galiléen a ses coordonnées d'espace \ x_1;x_2;x_3 et sa coordonnée de temps \ x_0 = c.t, subissant toutes une modification en cas de changement de référentiel galiléen. Il n'y a donc plus de temps absolu, pourtant le temps d'un référentiel quelconque, galiléen ou non, permet toujours de paramétrer l'évolution d'un système physique.
En choisissant de repérer le système dans un référentiel galiléen quelconque, donc avec les coordonnées \ (x_0;x_1;x_2;x_3), on peut choisir un temps t0 d'un autre référentiel quelconque, galiléen ou non, pour paramétrer son évolution.
Le lagrangien \ L = L(x_0;x_1;x_2;x_3;V_0;V_1;V_2;V_3) = L(x_i;V_i) exprimé à l'aide des coordonnées et de la vitesse peut donc s'écrire \ L(x_i;V_i) = L(x_i(t_0);V_i(t_0)) , avec V_i = \frac{dx_i}{dt_0}.
  • Si on choisit t_0 = \frac{x_0}{c}~~ le temps du référentiel des coordonnées, le lagrangien et les équations qui en sont tirées donnent, à l'approximation aux petites vitesses devant c~, le lagrangien et les propriétés de la mécanique classique. On dira alors travailler sans la quadri-écriture car seules les coordonnées spatiales apparaissent en général.
  • Si on choisit t_0 =~~ le temps propre, avec dt_0 = \frac{ds}{c}~~, on obtient des résultats équivalents mais dont l'écriture est jugée plus élégante et s'approche de celle de la relativité générale. On remarquera qu'un repère propre n'est galiléen que si le corps est libre. Avec le temps propre, on dira travailler en quadri-écriture car les quatre coordonnées du référentiel apparaissent dans les calculs.
  • Si on choisit t0 un temps autre quelconque, on peut travailler plus facilement avec les dérivées partielles qu'en utilisant les deux autres temps précédents; mais les résultats, bien qu'équivalents, ont une écriture moins maniable et moins élégante. Dans ce cas, on dira aussi travailler en quadri-écriture, pour la même raison.
Avec la quadri-écriture

Par commodité, nous adopterons la convention de sommation d'Einstein dans l'espace de Minkowski : pour deux quadri-vecteurs \ (V_0;V_1;V_2;V_3)\ et \ (U_0;U_1;U_2;U_3), on définit le produit scalaire \ V^iU_i par  V^iU_i = \Sigma_{i=0}^3V^i.U_i = V_0.U_0-V_1.U_1-V_2.U_2-V_3.U_3 = V_iU^i , avec \ V^0 = V_0 et pour i=1;2;3 \ V^i = -V_i

On a alors : \ (V_0)^2 - (V_1)^2 - (V_2)^2 - (V_3)^2 = V^iV_i

On montre que :  \frac{\partial V_jV^j}{\partial V_i} = 2V^i

De manière similaire, on écrira : \partial^i = \frac{\partial}{\partial x_i} et \partial_i = \frac{\partial}{\partial x^i}

En utilisant un temps quelconque indéterminé \ t_0, l'action \ S = \int_{t_{0i}}^{t_{0f}}L_0 dt_0 permet d'obtenir les équations d'Euler-Lagrange, relativistes mais obtenues de la même manière que dans le cas classique, avec une coordonnées de plus :

\frac{d~~ }{dt_0} \frac{\partial L_0}{\partial V_j } \ -  \  \frac{\partial L_0}{\partial x_j} \ = \ 0~~ pour j=0;1;2;3

Il est important de remarquer que comme dans le cas classique, l'action et le lagrangien ne sont pas définis de manière unique : l'action est définie à l'addition près d'une fonction des extrémités du trajet et du temps, et le lagrangien est défini à l'addition près de la dérivée d'une fonction du temps (qui une fois intégrée donne une fonction des extrémités et du temps).

[modifier] Cas d'un corps libre

[modifier] Lagrangien d'un corps libre

Déterminons l'action et le lagrangien relativiste d'un corps libre.

Dans aucun référentiel galiléen la quadri-vitesse n'est nulle car le corps avance au moins dans la dimension temporelle.

Le lagrangien relativiste d'un corps libre doit, aux petites vitesses et en première approximation, être égal (peut-être à une constante additive près : l'ajout d'une constante ne change pas les équations d'Euler-Lagrange) au lagrangien classique.

Dans l'espace-temps de Minkowski, l'action détermine la trajectoire, et celle-ci ne dépend pas du référentiel d'où on l'observe. Donc l'action ne dépend pas des coordonnées, et, pour un corps libre, dépend seulement de la vitesse et est invariante par les transformations de Lorentz :

\ S = \int_{t_i}^{t_f}L dt est invariant par les transformations de Lorentz

Dans le référentiel propre du corps, \ dt = dt_0 est la variation du temps propre du corps ; \ L = L_0 et la vitesse spatiale du corps est nulle. Dans un référentiel galiléen, et avec l'hypothèse que le corps est libre, la quadri-vitesse est constante dans le temps (et n'est jamais nulle) donc le lagrangien aussi car il dépend de la seule vitesse.

Ainsi, dans le référentiel propre du corps le lagrangien propre, \ L_0  , est une constante dans le temps.

Vu depuis un autre référentiel galiléen, se déplaçant par rapport au référentiel propre à la vitesse spatiale \ v constante, on a : \ dt_0 = \sqrt{1-\frac{v^2}{c^2}}.dt

Donc : \ S = \int_{t_i}^{t_f} L_0.\sqrt{1-\frac{v^2}{c^2}} dt

\ v = vitesse spatiale relative entre le référentiel et le référentiel propre du corps = vitesse spatiale du corps dans le référentiel.

Donc : \ L = L_0.\sqrt{1-\frac{v^2}{c^2}} \approx \ L_0.(1 - \frac{v^2}{2c^2}) = L_0 - \frac{L_0}{2c^2}v^2 par l'approximation aux petites vitesses devant \ c.

En comparant au lagrangien classique \ L = \frac{1}{2}mv^2 (qui n'est pas réellement modifié par l'ajout de la constante L0) , on obtient : - \frac{L_0}{2c^2} = \frac{1}{2}m , d'où \ L_0 = -mc^2

Conclusion : dans un référentiel galiléen quelconque, le lagrangien est

\ L = -mc^2.\sqrt{1-\frac{v^2}{c^2}}

\ v  est la vitesse spatiale du corps dans ce référentiel.

[modifier] Impulsion et énergie

  • Par définition de l'impulsion  \vec{p}, on a : \vec{p} = \frac{ \partial L}{\partial \vec{v}} = \frac{m\vec{v}}{\sqrt{1-\frac{v^2}{c^2}}}
L'énergie est définie par : \ E = \vec{p}.\vec{v} - L
On obtient : \ E = \frac{mc^2}{\sqrt{1-\frac{v^2}{c^2}}}
En particulier, pour v = 0, l'énergie au repos est \ E = mc^2
  • En exprimant l'énergie en fonction de l'impulsion, on obtient : \ E^2 = p^2.c^2 + m^2.c^4 ou encore \  m^2.c^4 = E^2 - p^2.c^2
  • On remarquera que bien qu'ayant la dimension d'une énergie, le lagrangien relativiste n'est pas l'énergie cinétique : cette dernière vaut
\ E_c = \frac{mc^2}{\sqrt{1-\frac{v^2}{c^2}}} - mc^2 = mc^2.\left(\frac{1}{\sqrt{1-\frac{v^2}{c^2}}} - 1\right)
On a bien  \ E_c \  \frac{1}{2} m \ v^2 \ à l'approximation aux petites vitesses devant \ c

[modifier] Avec la quadri-écriture

  • On constate que \ L.dt = -mc^2.\sqrt{1-\frac{v^2}{c^2}}.dt = -mc.\sqrt{(c.dt)^2-(dx_1)^2-(dx_2)^2-(dx_3)^2} = -mc\sqrt{dx_idx^i} = -mc.ds , en utilisant l'égalité  v_i = \frac{dx_i}{dt} et la définition adéquate de \ ds , appelé « temps propre » du corps.
En utilisant le fait que \ ds = \sqrt{dx_idx^i} est le temps propre du corps, l'action minimisée entre deux points de l'espace-temps \ S = -mc\int_A^Bds montre que le chemin suivi par la particule pour aller du point A au point B est celui qui maximise le temps propre, car le terme négatif mc transforme la minimisation de \ S = -mc\int_A^Bds en maximisation de \int_A^Bds.
En factorisant par \ dt_0 , un temps quelconque paramétrant le système (et n'est donc pas obligatoirement le temps propre), on obtient : \ L.dt = -mc.\sqrt{V_iV^i}.dt_0 = L_0.dt_0
, en utilisant la quadri-vitesse pas obligatoirement propre \ V = (V_0;V_1;V_2;V_3) définie par : \ V_i = \frac{dx_i}{dt_0} ,avec \ x_0 = c.t.
Le lagrangien relativiste d'une particule libre, paramétrée par le temps quelconque \ t_0, s'exprime donc :

\ L_0 = -mc. \sqrt{V_iV^i} = -mc.\frac{ds}{dt_0}.

  • On se rappelle que la quadri-impulsion, comme l'impulsion, est définie par P^i = \frac{\partial L_0}{\partial V_i}
D'où :  P^i = -mc\frac{V^i}{\sqrt{V^jV_j}}
Pour i = 0 , on obtient : P^0 = -mc.\frac{(\frac{c.dt}{dt_0})}{(\frac{ds}{dt_0})} = -mc.\frac{c.dt}{ds} = -\frac{mc}{\sqrt{1-\frac{v^2}{c^2}}} = -\frac{E}{c}
Pour i = 1;2;3 , de manière similaire au cas i=0, on obtient : (P^1,P^2;P^3)= \frac{m\vec{v}}{\sqrt{1-\frac{v^2}{c^2}}} =  \vec{p}.
Le carré de la "norme" de la quadri-impulsion est \  P^jP_j = (P_0)^2-(P_1)^2-(P_2)^2-(P_3)^2 = \frac{(-E)^2}{c^2} - (\vec{p})^2, et aussi \ P^iP_i = m^2.c^2.\frac{V^iV_i}{(\sqrt{V^jV_j}\ )^2} = m^2.c^2
D'où la formule déjà vue : \ m^2.c^4 = E^2 - p^2.c^2
  • La constance de la quadri-impulsion, démontrée à partir des équations d'Euler-Lagrange, permet de montrer que l'énergie E et l'impulsion spatiale sont constantes par rapport au temps \ t_0~.
  • La constante \ P^iV_i-L par rapport au temps \ t_0~ est en fait la constante 0 ; une petite manipulation permet d'en déduire l'égalité déjà vue \ m^2.c^4 = E^2 - p^2.c^2.
En calculant \ P^iV_i-L pour i∈{1;2;3} on retrouve l'énergie et l'égalité déjà citées.
  • On montre facilement que quel que soit le temps \ t_0~ choisi, s'il est celui d'un repère galiléen, la vitesse \ V_i et la "pseudo-norme" \sqrt{V^jV_j} sont constantes par rapport au temps \ t_0~ : c'est une conséquence directe de la définition des repères galiléens, et du fait que le corps est libre.
  • Dans le cas particulier où \ dt_0 est le temps propre \frac{ds}{c}, alors les quadri-vitesse et quadri-impulsion sont propres, et on a l'égalité particulière \sqrt{V^jV_j} = \frac{ds}{dt_0} = c.\frac{ds}{ds} = c , qui peut être embarrassante pour l'utilisation des dérivées partielles dans le travail ci-dessus, et qui donne \ P^0 = -m.V^0 = -\frac{E}{c} et pour i=1;2;3  \ P^i = m.V^i = p_i .

[modifier] Cas d'un corps dans un champ électromagnétique

[modifier] Sans la quadri-écriture

Comme dans le cas classique, le lagrangien peut être défini en utilisant un potentiel électromagnétique  (\phi(\vec{q},t), \vec{A}(\vec{q},t)) :

 L = L(\vec{q},\vec{v},t)  = \ -m.c^2.\sqrt{1-\frac{v^2}{c^2}} - e\phi(\vec{q},t) + e. \vec{v} \cdot \vec{A}(\vec{q},t)

En prenant encore  \vec{p} = \frac{m\vec{v}}{\sqrt{1-\frac{v^2}{c^2}}} , les équation d'Euler-Lagrange donnent :

 \dot{\vec{p}}= e \left(\vec{E} + \vec{v} \wedge \vec{B}\right)

ce qui n'est pas une égalité pratique à utiliser car la dérivation de  \vec{p}~~ est laborieuse.

L'impulsion est définie par : \vec{P} = \frac{ \partial L}{\partial \vec{v}} = \frac{m\vec{v}}{\sqrt{1-\frac{v^2}{c^2}}} + e.\vec{A} = \vec{p} + e.\vec{A}

On prendra donc soin de distinguer \vec{p} et \vec{P}

L'énergie est définie par : \ E = \vec{P}.\vec{v} - L

On obtient : \ E = \frac{mc^2}{\sqrt{1-\frac{v^2}{c^2}}} + e.\phi

Et après quelques calculs pour exprimer l'énergie en fonction de l'impulsion : \ (E-e\phi)^2 = \left(\vec{P} - e.\vec{A}\right)^2.c^2 + m^2.c^4

Toutes les approximations aux petites vitesses devant c redonnent les résultats classiques.

À partir du potentiel électromagnétique, le premier groupe des équations de Maxwell se démontre sans difficulté : l'équation de Maxwell-Faraday et l'équation de conservation du flux magnétique.

[modifier] Avec la quadri-écriture

Le champ électromagnétique se manifeste sous forme d'un quadri-vecteur, appelé quadri-potentiel électromagnétique, \ A^j dont l'interaction avec la particule de charge \ e se manifeste sous forme lagrangienne par \ e.A^j.dx_j

La définition de l'action relativiste infinitésimale d'un champ électromagnétique est donc \  L.dt = \ -mc.\sqrt{dx_j.dx^j} - e.A^j.dx_j .

On pose  F^{ij} = \partial^i A^j - \partial^j A^i tenseur champ électromagnétique.

En prenant \ t_0 le temps propre de la particule, les équations d'Euler-Lagrange donnent les équations du mouvement de la particule :

m. \frac{dV^i}{dt_0} = e.V_j.F^{ij}

Que l'on peut écrire aussi :

mc. \frac{dV^i}{ds} = e.V_j.F^{ij}

En prenant : champ électrique = \vec{E} = c.\left(F^{01},F^{02},F^{03}\right) et champ magnétique = \vec{B} = \left(F^{23},F^{31},F^{12}\right) , on retrouve la force de Lorentz sous son écriture habituelle.


  • On se rappelle que la quadri-impulsion, comme l'impulsion, est définie par P^i = \frac{\partial L_0}{\partial V_i}
D'où :  P^i = -mc\frac{V^i}{\sqrt{V^jV_j}} - e.A^i
Pour i = 0 , on obtient : P^0 = -mc.\frac{(\frac{c.dt}{dt_0})}{(\frac{ds}{dt_0})} - e.A^0 = -mc.\frac{c.dt}{ds} - e.\frac{\phi}{c} = -\frac{mc}{\sqrt{1-\frac{v^2}{c^2}}} - \frac{e}{c}.\phi = -\frac{E}{c}
Pour i = 1;2;3 , de manière similaire au cas i=0, on obtient : (P^1,P^2;P^3)= \frac{m\vec{v}}{\sqrt{1-\frac{v^2}{c^2}}} + e.\vec{A} =  \vec{p} + e.\vec{A} = \vec{P}.
De manière similaire au cas d'un corps libre, la constante \ P^iV_i-L par rapport au temps \ t_0~ est en fait la constante 0, et une petite manipulation permet d'en déduire l'égalité déja vue \ m^2.c^4 = (E - e.\phi)^2 - \left(\vec{P} - e\vec{A}\right)^2.c^2.

[modifier] L'invariance de jauge du potentiel et du tenseur électromagnétiques

On remarque que si à la place du quadri-potentiel électromagnétique \ A^j , on a le quadri-potentiel \ A'^j =  A^j + \partial^j \phi \ \phi est une fonction quelconque des coordonnées, alors le lagrangien devient  L' = L + \partial^j \phi.dx_j et l'action S' = S + \int^{t_f}_{t_i}\partial^j \phi.dx_j = S + \phi (x_i(t_f)) - \phi (x_i(t_i))

En appliquant la méthode variationnelle qui fait varier le chemin en gardant les extrémités fixes, le terme \ \phi (x_i(t_f)) - \phi (x_i(t_i)) est éliminé. Donc les deux potentiels \ A^j et \ A'^j =  A^j + \partial^j \phi donnent les mêmes équations du mouvement : on appelle cela l'« invariance de jauge ».

On constate d'ailleurs que dans les équations du mouvement, le tenseur électromagnétique, terme représentant l'influence du champ électromagnétique, est bien invariant de jauge :  F'^{ij} = \partial^i A'^j - \partial^j A'^i =  \partial^i A^j - \partial^j A^i + \partial^i \partial^j \phi- \partial^j \partial^i \phi = \partial^i A^j - \partial^j A^i = F^{ij}

par le théorème de Schwarz : \partial^i \partial^j = \partial^j \partial^i.

[modifier] Cas d'un champ « de force »

En physique classique, l'influence d'un corps sur un autre se transmet instantanément ; avec l'arrivée de l'électromagnétisme de Maxwell et plus encore avec celle de la relativité restreinte, l'influence se transmet au maximum à la vitesse de la lumière (dans le vide).

Ainsi, entre le corps influent et le corps infuencé, il se balade quelque chose dans l'espace, en général à la vitesse de la lumière, qui se répand dans l'espace et dont l'effet est un changement de trajectoire du corps influencé.

Suivant quelles propriétés ce champ (appelé ainsi car il a tendance à occuper l'espace) est-il créé, se déplace-t'il, est-il influencé par son environnement, etc ?

On peut répondre à ces questions à l'aide du principe de moindre action.

[modifier] Densité lagrangienne et équations d'Euler-Lagrange associées

  • Un champ est caractérisé par une étendue importante dans l'espace, on ne peut donc pas le repérer par les coordonnées (t,\vec{q},\vec{v}), mais on peut le repérer (ou plutôt le quantifier) par ses projections \ (A_0,A_1,A_2,A_3) sur les axes (x0,x1,x2,x3) et par les variations \frac{\partial A_i}{\partial x_j} = \partial^j A_i de ses projections (en supposant par avance que nous pourrons en déduire les dérivées secondes, comme dans le cas d'un corps localisé).
Nous utiliserons donc \ (A_0,A_1,A_2,A_3) et \frac{\partial A_i}{\partial x_j} = \partial^j A_i , avec i,j ∈{0,1,2,3} pour un champ de la même manière que les quadri-coordonnées et la quadri-vitesse pour un corps localisé, les coordonnées (x0,x1,x2,x3) jouant le rôle de paramètres, comme seul le temps le faisait avant.
  • L'action d'un champ est donc de la forme : S = \int_V \Lambda(A_i;\partial^jA_i)d\Omega
Où V est le quadri-volume dans lequel on va appliquer la méthode variationnelle, \ \Lambda est appelé la « densité lagrangienne » et \ d\Omega = dx_0.dx_1.dx_2.dx_3 = c.dt.dx_1.dx_2.dx_3
  • Par une démonstration semblable à celle déja vue dans le cas d'un corps localisable, et en utilisant la convention de sommation d'Einstein, on obtient les équations d'Euler-Lagrange pour la densité lagrangienne :
\partial^j \frac{\partial \Lambda}{\partial (\partial^jA_i)} - \frac{\partial \Lambda}{\partial A_i} = 0


[modifier] Tenseur impulsion-énergie d'un champ

La densité lagrangienne \Lambda = \Lambda(A_j;\partial_kA_j) d'un champ étant donnée,


en posant

T^k_{~i} = \frac{\partial \Lambda}{\partial(\partial_kA_j)}.\partial_iA_j - \delta^k_{~i}\Lambda

tenseur « impulsion-énergie », on a :

\partial_kT^k_{~i} = 0

ce qui exprime sa conservation.

En posant : \ w = T^0_{~0} = \frac{\partial \Lambda}{\partial(\partial_0A_j)}.\partial_0A_j - \Lambda la densité d'énergie et  P^k = c.T^k_{~0} = c.\frac{\partial \Lambda}{\partial(\partial_kA_j)}.\partial_0A_j pour k∈{1;2;3} les composantes du vecteur \vec P.

Nous avons alors les deux équations équivalentes

\partial_kT^k_{~0} = 0

\frac{\partial w}{\partial t} + div(~\vec{P}~) = 0

qui est l' « équation de conservation de l'énergie » : localement, la variation dans le temps de la densité d'énergie \ w est égale à l'opposée de la variation de densité d'impulsion par les composantes spatiales \ P_i.

[modifier] Densité lagrangienne d'un champ électromagnétique libre

La densité lagrangienne du champ électromagnétique est :

\Lambda_{em} = -\frac{1}{4\mu_0}F^{ij}F_{ij}


[modifier] Les équations du champ électromagnétique

L'hypothèse de ce paragraphe est qu'il y a un courant de particules (voir même d'une seule particule) non influencé par le champ électromagnétique. Avec cette condition, on étudie les modifications du champ.


La densité lagrangienne à utiliser est :

\Lambda = -A^iJ_i - \frac{1}{4\mu_0}F^{ij}F_{ij}

Les équations d'Euler-Lagrange donnent :

 \partial^i F_{ik} = \mu_0.J_k

Pour k = 0 , on obtient   \mathrm{div}\ \overrightarrow{E} \ = \ \frac{\rho}{\varepsilon_0} l'équation de Maxwell-Gauss ou équation de conservation de la charge.

Pour k∈{1;2;3} on obtient   \overrightarrow{\mathrm{rot}} \ \overrightarrow{B} \ = \ \mu_0 \overrightarrow{j} \ + \ \varepsilon_0 \mu_0 \  \frac{\partial \overrightarrow{E}}{\partial t} l'équation de Maxwell-Ampère.

De plus, à partir de  \partial^i F_{ik} = \mu_0.J_k , et en utilisant l'anti-symétrie de \ F_{ik} et le théorème de Schwarz ( ~~\partial^{ik} = \partial ^{ki}~~ ), on obtient :  \mu_0. \partial^k J_k = - \mu_0. \partial^i J_i

D'où les deux présentations de « l'équation de conservation de la charge » :

 \partial^k J_k = 0~~

~~\mathrm{div}\ (~\vec{j}~) + \frac{\partial \rho}{\partial t} = 0

[modifier] Tenseur impulsion-énergie du champ électromagnétique

[modifier] En relativité générale

On doit à David Hilbert, en 1916, la première utilisation du principe de moindre action pour obtenir les équations de la relativité générale, notamment les équations du champ gravitationnel.[réf. nécessaire]

Pour la relativité générale aussi, les équations peuvent être obtenues sans faire appel au principe de moindre action : le principe d'équivalence, exprimé sous la forme « on peut toujours trouver un référentiel annulant localement le champ de gravitation », permet de retrouver directement les équations du mouvement d'une particule ; et l'unicité de la forme du tenseur géométrique qui s'annule par la dérivée covariante, unicité prouvée par Élie Cartan, permet de trouver les équations du champ de gravitation, ce qui fût la méthode originelle d'Einstein (bien que l'unicité en question n'était pas encore prouvée à l'époque).

Si les équations de la relativité générale sont données, on peut en déduire l'action permettant d'appliquer le principe. En particulier, avec les équations des géodésiques on peut retrouver la métrique ds^2\, associée.

[modifier] Particule

[modifier] Particule dans un champ de gravitation

Dans ce travail, on utilise l'hypothèse que la particule ne modifie pas son environnement : la masse de la particule ni sa position ne changent le champ de gravitation, cette masse doit donc être « petite ».

En vertu du principe d'équivalence d'Einstein, la gravitation est localement équivalente au choix d'un référentiel accéléré.

Dans le cadre de la relativité restreinte, en prenant un référentiel accéléré (coordonnées \ (x'_0;x'_1;x'_2;x'_3)), la perception locale est donc un champ de gravitation, et le changement de référentiel par rapport à un référentiel inertiel (coordonnées \ (x_0;x_1;x_2;x_3)) impose une métrique aux coefficients non triviaux : \ ds^2 = (x_0)^2- (x_1)^2- (x_2)^2-(x_3)^2 = g^{ij}(x')x'_ix'_j. Elle suffit pour déterminer les équations du mouvement dans ce référentiel du fait du principe de moindre action en relativité restreinte.

Le principe d'équivalence permet de dire qu'un champ gravitationnel réel (non dû au choix du référentiel) est aussi déterminé par la métrique \ ds^2 (et la métrique est déterminée par le champ de gravitation) ; bien que l'utilisation d'une métrique \ ds^2 = g^{ij}(x)x_ix_j = g^{ij}x_ix_j qui ne soit pas causée, et donc pas compensable au delà d'un domaine local de l'espace-temps, par un changement de référentiel implique que l'espace-temps n'est pas euclidien (voir l'expérience par la pensée du disque en rotation, décrit dans relativité générale), et que l'on sort alors du cadre de la relativité restreinte pour construire une nouvelle théorie : la relativité générale.

On peut donc rester dans la continuité de la relativité restreinte, et affirmer que l'action infinitésimale d'une particule ponctuelle, influencée par la seule gravitation, en relativité générale est :

dS = -mc\sqrt{g^{ij}dx_idx_j}

où on suppose que \ g^{ij} = g^{ji} sans rien enlever à la généralité.

En utilisant le fait que \ ds = \sqrt{g^{ij}dx_idx_j} est le temps propre de la particule, l'action minimisée entre deux points de l'espace-temps \ S = -mc\int_A^Bds montre que, comme en relativité restreinte, c'est le temps propre pour aller du point A au point B qui est maximisé (localement) par le principe. Les géodésiques sont les chemins qui maximisent (localement) le temps propre de la particule.

Pour garder la cohérence physique, on a besoin de supposer que les \ g^{ij} sont continus ; pour pouvoir travailler avec des outils connus, c'est-à-dire des dérivations, mais aussi pour supposer que le champ gravitationnel est continu, on doit supposer qu'ils sont différentiables. Par la suite, pour les équations d'Einstein, il sera indispensable de supposer qu'ils sont C2.

En considérant un temps t0 quelconque :

\frac{dS}{dt_0} = L_0 = -mc\sqrt{g^{ij}V_iV_j}

On utilise toujours les équations d'Euler-Lagrange \ \frac{d~~ }{dt_0} \frac{\partial L_0}{\partial V_k } \ -  \  \frac{\partial L_0}{\partial x_k} \ = \ 0~~ après avoir divisé par le coefficient \ -mc ici inutile.


On obtient l'équation :

\dot{V}_m + \Gamma_m^{ij}V_iV_j = 0

que l'on peut aussi écrire :

\frac{d^2x_k}{ds^2} + \Gamma_k^{ij}\frac{dx_i}{ds}\frac{x_j}{ds} = 0

ou encore :

 \frac{DV_k}{ds} = 0

avec la « dérivée covariante » : DV_k = dV_k + \Gamma_k^{ij}V_idV_j et DV^k = dV^k + \Gamma^k_{ij}V^idV^j , où \ V_k = \frac{dx_k}{dt_0} pour \ t_0 = temps propre.

Le symbole de Christoffel \Gamma_k^{ij} s'impose comme la manifestation de la gravitation dans les équations du mouvement.

Les équations du mouvement ne dépendent pas de la masse de la particule (nommée ainsi car nous avons négligé son étendue spatiale et son influence sur son environnement) : toutes les particules suivent les mêmes trajectoires (à conditions initiales identiques), c'est l'équation des géodésiques en relativité générale, en présence de la seule gravitation.

Toutefois, ces équations du mouvement ne sont pas valables pour une particule de masse nulle car dans ce cas, on a dès le départ ~dS = 0~~, ce qui interdit tous les calculs menés ci-dessus ; on a aussi ~ds = c.dt_0 = 0~~ car le temps propre ne s'écoule pas pour une particule de masse nulle (voir Relativité restreinte), le terme \dot{V}_m ne peut en aucun cas avoir de sens. Il faut considérer l'onde associée à la particule pour avoir une équation ayant un sens, d'ailleurs la lumière était comprise comme une onde (électromagnétique) et comme une particule (le photon, de masse nulle) lorsque la relativité générale a été écrite.

[modifier] Particule dans un champ électromagnétique

De manière similaire à la relativité restreinte, la définition de l'action relativiste infinitésimale d'une particule ponctuelle de charge \ e dans un champ électromagnétique est \  L.dt = \ -mc.\sqrt{g^{ij}dx_i.dx_j} - e.A^j.dx_j .

Par des calculs parfaitement similaires, on en tire les équations du mouvement :

m.(\dot{V}^k + \Gamma^k_{ij}V^iV^j) = e.V_j.F^{kj}

que l'on peut écrire :

 mc.\left( \frac{d^2x^k}{ds^2} + \Gamma^k_{ij}\frac{dx^i}{ds}\frac{dx^j}{ds} \right) = e.F^{kj}\frac{dx_j}{ds}

ou encore :

 mc. \frac{DV^k}{ds} = e.F^{kj}V_j

[modifier] Champ de gravitation

Afin d'en déterminer la densité lagrangienne, puis les équations, il est nécessaire de développer un peu certaines considérations abordées ci-dessus, et même quelques nouvelles.

[modifier] Densité lagrangienne dans l'espace courbe

Du fait de l'invariance de la trajectoire du champ par rapport aux référentiels d'où on l'observe, l'action qui la caractérise S_g = \int L d \Omega doit être invariante par changement de référentiel.


En notant \ \Lambda le scalaire du champ, invariant par rapport aux changements de référentiels, la densité lagrangienne sera : \ L = \Lambda .|g|^{\frac{1}{2}}

[modifier] Définitions des tenseurs de Riemann, de Ricci, et de la courbure

À la manière d'Élie Cartan

En termes mathématiques, l'espace quadri-dimensionnel défini par les considérations ci-dessus est une variété C2 où les quadri-vitesses sont des vecteurs appartenant à l'espace vectoriel tangent au point où on a dérivé, cet espace vectoriel étant muni de la métrique \ g^{ij}.

Rappelons que les coordonnées (x0;x1;x2;x3) sont les coordonnées des points de la variété, munie d'un système de coordonnées quelconque, représentant le choix arbitraire du référentiel physique de l'observateur.

La mesure de la gravitation, qui influe sur les géodésiques, peut se faire à travers la différence d'orientation entre deux vecteurs résultant du transport d'un seul vecteur d'origine par deux chemins géodésiques différents vers un même point final.

  • L'équation des géodésiques \dot{V}_m + \Gamma_m^{ij}V_iV_j = 0 est équivalente à \frac{dV_k}{dt_0} = - \Gamma_k^{ij}V_i V_j.
Du fait que V_j = \frac{dx_j}{dt_0}, on déduit : dV_k = - \Gamma_k^{ij} V_i dx_j  ; sachant que l'on a \Gamma_k^{ij} = \Gamma_k^{ji} comme on le voit à partir de sa définition, on pourrait aussi bien écrire dV_k = - \Gamma_k^{ij} dx_i V_j  .
De manière similaire, on obtient dV^k = - \Gamma^k_{ij} V^i dx^j
  • Un vecteur  \left( A_i \right) est dit transporté parallèlement le long d'une géodésique si les variations de ses coordonnées vérifient dA_k = - \Gamma_k^{ij} A_i dx_j quand il est déplacé de \ (dx_j)_{j=0;1;2;3} le long de la géodésique.


  • On définit le tenseur de Riemann par :

R_i^{j,kl} = \partial^j \Gamma_i^{lk} - \partial^l \Gamma_i^{jk} + \Gamma_p^{lk} \Gamma_i^{jp} - \Gamma_p^{jk} \Gamma_i^{lp}

  • Le tenseur de Ricci est une contraction du tenseur de Riemann :  R^{ij}=R_k^{i,kj}
Sa formule montre que c'est un tenseur symétrique : \ R^{ij}=R^{ji}
  • La courbure riemannienne est le nombre obtenu par contraction du tenseur de Ricci : \ R=g_{ij}R^{ij}
  • Toutes les égalités utilisées dans « détails de la méthode d'Élie Cartan » étant indépendantes du référentiel choisi, et c'est aussi le cas pour les définitions des tenseurs de Riemann et de Ricci (c'est d'ailleurs pourquoi on se permet de les nommer tenseur ). C'est aussi le cas de la courbure \ R qui est donc candidat pour être \ \Lambda le scalaire invariant du champ de gravitation.
  • Élie Cartan a démontré que les scalaires invariants par changement de référentiel sont de la forme \ \alpha R + \beta~.
~\ \alpha indique simplement qu'un changement d'unité est toujours possible, \ \beta permet d'introduire la constante cosmologique.

[modifier] Outils analytiques

[modifier] Une application du principe d'inertie dans l'espace courbe

Pour que notre travail soit bien une conséquence du principe de moindre action, la méthode utilisée ici consiste à déterminer les propriétés de la variété à partir de la métrique de ses espaces tangents.

  • Les espaces vectoriels tangents (de dimension 4) sont munis de leur base « naturelle » {\ \ { \vec{e}^{~0}; \vec{e}^{~1} ; \vec{e}^{~2}; \vec{e}^{~3}} }  : si \ M(x_0;x_1;x_2;x_3) est le point où l'on considère l'espace tangent, on pose \vec{e}^{~i} = \left(~\frac{\partial x_j}{\partial x_i}~\right)_{j=0,1,2,3} ; ce que l'on écrit souvent \vec{e}^{~i} = \frac{\partial ~}{\partial x_i} .
Les équations des géodésiques sont des propriétés concernant les coordonnées \frac{dx_i}{dt_o} ou \frac{dx_i}{ds} de la quadri-vitesse le long de cette trajectoire, elles ne donnent pas d'indication pour la variation (la dérivation) d'un quadri-vecteur \vec{e}^{~i} d'un point à un autre de l'espace, ni même pour la dérivation du quadri-vecteur vitesse \vec V = V_i \vec e^{~i}.
Pour cela, nous pouvons utiliser un principe physique réécrit sur mesure pour la relativité générale :
  • Principe d'inertie : le long d'une géodésique, et en l'absence d'intervention extérieure, le (quadri-)vecteur vitesse d'une particule est constant.
C'est-à-dire : d\vec V = \vec 0
On en tire : d\vec V = \vec 0 = dV_i .\vec e^{~i} + V_i .d\vec e^{~i} = - \Gamma_i^{jk} dx_j V_k. \vec e^{~i} + V_i .d\vec e^{~i}
Le quadri-vecteur vitesse initial étant quelconque, on obtient :

 d\vec e^{~i} = \Gamma_k^{ij} dx_j \vec e^{~k}

En analysant les équations des géodésiques ou en tenant compte du fait que les « axes » des coordonnées ne sont pas obligatoirement des géodésiques, on ne peut pas affirmer que les coordonnées du quadri-vecteur vitesse sont constantes.


[modifier] La dérivée covariante

Soit \vec{A}(x) = A_i\vec e^{~i} un quadri-vecteur dans l'espace tangent au point \ M(x_0;x_1;x_2;x_3).

On a : d \vec{A}(x) = (dA_i) \vec e^{~i} + A_i d(\vec e^{~i}) = ( \partial^j A_i + A_k \Gamma_i^{jk})\vec e^{~i}dx_j = D^j A_i .\vec e^{~i}dx_j

En définissant la dérivée covariante par :

D^j A_i = \partial^j A_i + \Gamma_i^{jk} A_k

Propriété :

D^j A_{il} = \partial^j A_{il} + \Gamma_i^{jk} A_{kl}  + \Gamma_l^{jk} A_{ik}

D^j A_i^l = \partial^j A_i^l + \Gamma_i^{jk} A_k^l  - \Gamma_k^{jl} A_i^k

Et ainsi de suite avec tous les indices d'un tenseur, suivant leurs positions.

[modifier] Où l'on retrouve les tenseurs de Riemann, etc.

À l'aide de la dérivée covariante, et après quelques calculs, on trouve :  \left( D^iD^j -D^jD^i \right) A_k = R_k^{l,ij} dx_i dx_j A_l.

On obtient donc les notions déjà introduites « à la manière d'Élie Cartan ».

[modifier] Égalités et propriétés utiles
  • Théorème de Ricci : \ D_kg^{ij} = 0~ \quad ~ et ~\quad D_kg_{ij} = 0~
  • En posant \ g = \det (g^{ij}) \qquad , on a :   |g| = -g \qquad  g^{ij}.g_{ij} = \delta^i_i = 4 \qquad  \ dg = g~g_{ij}~dg^{ij}
  • Théorème d'Ostrogradski : \int_V \sqrt {-g}~ D_iA^i~d\Omega = \oint_{\part V} \sqrt {-g} A^i~dS_i , quand \ A^i est un tenseur.


  • La somme, la différence et la sommation d'Einstein de tenseurs définis dans le même espace tangent donnent un tenseur ; par contre s'il s'agit de tenseurs définis dans des espaces tangents différents, il n'est pas sûr que cela donne un tenseur.
Par exemple : le symbole de Christoffel est défini à partir du tenseur métrique. L'équation des géodésiques \Gamma_i^{jk}.V_k = \part^jV_i nous montre qu'il peut être défini à l'aide de \ \part^j V_i qui, bien que tenseur, est construit par une différence entre deux tenseurs (les quadri-vecteurs \  V_l(x_m) et \  V_l(x_m + dx_m)  ) définis dans deux espaces tangents différents : le symbole de Christoffel, lui, n'est pas un tenseur (sauf cas particuliers), comme on peut le montrer à l'aide de sa formule de définition.
  • Une égalité tensorielle démontrée en un point quelconque, mais en utilisant un référentiel particulier, est une égalité vraie en ce point et pour tous les référentiels : c'est là le principal intérêt d'utiliser des tenseurs.
Par exemple, en tout point il existe un référentiel en apesanteur (en chute libre dans le champ de pesanteur), c'est à dire pour lequel \Gamma_i^{jk} = 0. Dans un tel référentiel, on a R_i^{j,kl} = \partial^j \Gamma_i^{lk} - \partial^l \Gamma_i^{jk} et D^j A_i = \partial^j A_i quand \ A_i est un tenseur : ce qui est plus simple à utiliser pour justifier une égalité tensorielle qui sera vraie quel que soit le référentiel.

[modifier] Les équations d'Einstein du champ de gravitation dans le cas extérieur

Les tenseurs sont utilisés pour s'assurer que les égalités sont vraies quel que soit le point d'observation du physicien et quelque soit son référentiel. Les tenseurs ne transportent que des informations liées au point d'observation et à son espace tangent, du coup, les informations qui y sont utilisées et qui en sont produites ne sont que locales : ce sont des informations sur les tenseurs, mis à part les données universellement valables comme les constante c, G, et autres que l'on pourra y trouver.

Le premier cas des équations du champ est le cas où il n'y a pas de matière (localement) : on parle du « cas extérieur », sous entendu « à la matière ».

Dans ce cas, la seule composante de l'action est la composante du champ gravitationnel \ S_g = K. \int \sqrt{-g}.R.d\Omega , où \ K est une constante liée au choix des unitées : pour les unités MKSA, on prend \ K = - \frac{c^3}{4 \pi G} , le signe \ - étant dû au principe de minimisation de l'action.

Pour trouver les équations du champ de gravitation sous la forme de tenseurs de densité d'énergie qui soient symétriques, il est plus simple de transformer le lagrangien sous l'intégrale de l'action que d'utiliser les équations d'Euler-Lagrange. Le principe variationnel est appliqué en faisant varier les termes de la métrique \ g^{ij}, qui est la manifestation lagrangienne de la gravitation, d'après le principe d'équivalence tel qu'appliqué plus haut.


Les équations déduites sont :

\ R_{ij} - \frac{1}{2}g_{ij}R = 0

En faisant la « contraction » \ g^{ij}R_{ij} - \frac{1}{2}g^{ij}.g_{ij}R = 0, on obtient \ R = 0 , ce qui ne signifie pas que l'espace est plat, mais plutôt qu'il s'agit d'une surface minimale à quatre dimensions, tendue entre les différentes masses qui y évoluent.

Les équations d'Einstein dans le cas extérieur sont donc :

\ R_{ij} = 0

[modifier] Les équations d'Einstein du champ de gravitation dans le cas intérieur

Le deuxième cas des équations du champ est le cas où il y a de la matière (localement) : on parle du « cas intérieur », c'est-à-dire « dans la matière ».

Dans ce cas, l'action est composée de l'action du champ gravitationnel \ S_g = K. \int \sqrt{-g}.R.d\Omega et de l'action de la matière, en y incluant le champ électromagnétique, que l'on écrit \ S_m = \frac{1}{c} \int\sqrt{-g}. \Lambda_m d\Omega.


Les équations déduites sont :

\ R_{ij} - \frac{1}{2}g_{ij}R = \chi T_{ij}

Avec la contraction similaire au cas extérieur, sachant que \ g_{ij}g^{ij} = 4 et en posant \ T = g^{ij}T_{ij} , on a \ R = - \chi T. La courbure principale est donc proportionnelle à la densité d'énergie totale \ T = g^{ij}T_{ij} (ou trace du tenseur \ T_{ij}).

[modifier] Voir aussi

[modifier] Articles connexes

[modifier] Liens externes

[modifier] Cours en ligne

[modifier] Bibliographie

  • Lev Landau et Evguéni Lifchitz, Physique théorique, éd. MIR, Moscou [détail des éditions]
  • Richard P. Feynman ; Le cours de physique de Feynman - Electromagnétisme (I), chapitre 19, InterEditions (1979), ISBN 2-7296-0028-0. Réédité par Dunod (2000), ISBN 2-1000-4861-9
  • Jean-Claude Boudenot ; Électromagnétisme et gravitation relativistes, ellipse (1989), ISBN 2729889361
  • Jean-Louis Basdevant ; Principes variationnels & dynamique, Vuibert (2005), ISBN 2711771725.
  • Florence Martin-Robine ; Histoire du principe de moindre action, Vuibert (2006), ISBN 2711771512.
  • Edgard Elbaz ; Relativité générale et gravitation, ellipse (1986).

[modifier] Notes

  1. Voir par exemple http://serge.mehl.free.fr/chrono/Maupertuis.html
  2. Principe de Maupertuis dans : §44 de Mécanique,Landau-Lifchitz, traducteur Claude Ligny, 1960, Éditeur MIR ou p173 à 175 de Calcul des variations par Mr Pierre Bérest, 1997, Éditeur ellipse, ISBN 2 7298 9704 5
  3. Florence Martin-Robine ; Histoire du principe de moindre action, Vuibert (2006), p 206-209; et R.Feynmann, Conférence Nobel, dans La nature de la physique, Seuil (1980).
  4. Florence Martin-Robine ; Histoire du principe de moindre action, Vuibert (2006), p 209.
  5. Histoire du principe de moindre action par Florence Martin-Robine, chez Vuibert, 2006
  6. L. Landau et E. Lifchitz, trad. Claude Ligny,Physique théorique, tome 1 « Mécanique », éditions MIR, Moscou, 1982, (ISBN 5-03-000198-0 et ISBN 5-03-000197-2)
  7. La généralisation à un nombre quelconque de degrés de liberté ne pose pas de problème de principe.