Structure affine

Un article de Wikipédia, l'encyclopédie libre.

Sommaire

[modifier] Définitions d'un espace affine

Il existe de nombreuses manières de définir un espace affine. Dans tous les cas, nous supposerons donnés au moins :

  • un ensemble  E \, non vide, socle du futur espace affine;
ses éléments seront appelés « points » et notés par des lettres latines majuscules : A , B ,...
  • un corps (  \mathbb K \, , + , x ) , noté «  \mathbb K \, » en abrégé , d'éléments neutre « 0 » pour la loi additive et « 1 » pour la loi multiplicative;
les éléments du corps seront appelés « scalaires » et notés par des lettres grecques minuscules : λ , μ ,...

[modifier] Définition « générale »

Un espace affine sur un corps commutatif se définit alors de manière formelle comme un paragroupe muni d’une loi de composition externe sur ce corps commutatif.

La loi interne du paragroupe est souvent appelée loi milieu, car dans un espace affine euclidien, cette loi n’est autre que celle qui associe à deux points leur milieu géométrique. En symétrisant cette loi, on aboutit à un espace vectoriel, celui associé à l' espace affine.
La loi externe de l'espace affine vérifie d'ailleurs des propriétés analogues à celles de la loi externe d’un espace vectoriel.

D'où l'idée de « construire » la structure affine à partir de celle d'espace vectoriel, ce qui permet de ramener la théorie des espaces affines au moins en partie à celle des espaces vectoriels, plus simple.

Pour obtenir ce résultat, on peut « transférer » la structure d'un  \mathbb K \,-espace vectoriel  V \, à l'ensemble  E \, grâce à une application entre  V \, et  E \, possédant les propriétés adéquates. Il existe plusieurs solutions, qui donnent naissances à autant de définitions équivalentes des espaces affines.

Remarques pour la suite de l'article:

  • notations : l' espace vectoriel (  V \,, \ ^{\dot +} , · ), noté «  V \, » en abrégé , a pour élément neutre «   \vec 0 \,  » ; ses éléments sont appelés « vecteurs » et notés par des lettres latines minuscules surmontées d'une flèche :  \vec u ,  \vec v ,...
  • par rapport à ce que l'on trouve habituellement dans la littérature, certaines propriétés ont été "détaillées" de façon à faire ressortir les liens entre les trois définitions (il faudrait d'ailleurs plutôt parler de familles de définition).

[modifier] Définition « naturelle »

Cette définition fait appel au carré cartésien de  E \,, dont les éléments sont appelés traditionnellement bipoints.

Historiquement, les vecteurs ont été définis comme classe d' équipollence de bipoints avant que la définition axiomatique des espaces vectoriels ne soit établie. Il existe ainsi une correspondance φ de E 2 dans V qui associe un vecteur à chaque bipoint. C'est elle qui est utilisée dans la définition « naturelle » pour transporter la structure de l'espace vectoriel V vers l'ensemble E.

Pour que ce "transport" fonctionne, il faut :

  • d'une part, que l'on puisse "passer" des vecteurs aux points et vice versa sans problème; cela revient à exiger :
  • que φ soit une application, donc une loi scalaire,
  • et que l'une au moins de ses relations inverses, relations de V × E dans E, soit aussi une application, donc une loi externe;
  • et d'autre part, que l'on dispose d'une formule permettant le transport proprement dit : c'est la fameuse relation de Chasles.

Rappelons au passage que toute relation ternaire a deux relations inverses, l'une à gauche et l'autre à droite, que l'on peut appeler en abrégé RTIG et RTID. Cela généralise la notion de relation réciproque d'une relation binaire ou de fonction réciproque. Par exemple, l' exponentiation (élévation à une puissance) a pour relations inverses l' extraction de racine et le logarithme.

D'où la définition détaillée suivante :

Un espace affine est ainsi un ensemble  E \, muni d'une relation scalaire φ de  E \times E \, dans  V \, vérifiant les propriétés suivantes :

  • C1 :   φ est une application ; cette propriété se décompose en deux parties :
  • C1a :   φ est fonctionnelle ( en d'autres termes, φ est une fonction ) :
Tout bipoint a au plus un vecteur comme image par φ,
ou, plus formellement :
 \forall\ ( P , Q ) \in E^2 , \forall\ ( \vec u , \vec v ) \in V^2 ,\ [ \ ( P , Q ) \varphi \vec u \wedge ( P , Q ) \varphi \vec v \ ] \Rightarrow [ \ \vec u = \vec v \ ] \,
Nous pouvons dès lors simplifier les énoncés en utilisant une variante de la notation fonctionnelle pour φ :
\ [ \ ( P , Q ) \varphi \vec u \ ] \rightarrow [ \ \vec u = \varphi ( P , Q ) = \overrightarrow {P Q\ } \ ] \,
  • C1b :   φ est applicative :
Tout bipoint a au moins un vecteur comme image par φ,
ou, plus formellement :
 \forall\ ( P , Q ) \in E^2 , \exists\ \vec u \in V \, ,\ \vec u = \overrightarrow {P Q\ } \,
  • C2 :   la RTID ou « relation inverse à droite » de φ est une application ; cette propriété se décompose en deux parties :
  • C2a :   la RTID de φ est fonctionnelle ( c'est une fonction ) :
Tout couple (vecteur, point) a au plus un point comme image par la RTID de φ
ce qui peut se reformuler en :
Si deux bipoints ont même image par φ et même origine, alors leur extrêmité est aussi la même :
 \forall\ ( P , Q , R ) \in E^3 ,\ [ \ \overrightarrow {P Q\ } = \overrightarrow {P R\ }  \ ] \Rightarrow [ \ Q = R \ ] \,
  • C2b :   la RTID de φ est applicative :
Tout couple (vecteur, point) a au moins un point comme image par la RTID de φ
ce qui peut se reformuler en :
pour tout vecteur de V et tout point de E, il existe au moins un bipoint de E2 dont le point soit l'origine et le vecteur l'image par φ :
 \forall\ P \in E , \forall\ \vec u \in V , \exists\ Q \in E \, ,\ \vec u = \overrightarrow {P Q\ } \,
Attention à ne pas confondre les propriétés C2b et C1b !
La propriété C2b implique que φ est surjective.
 \forall\ ( P , Q , R ) \in E^3 ,\ \overrightarrow {P Q\ } \dot + \ \overrightarrow {Q R\ } = \overrightarrow {P R\ } \,
La propriété C3 a pour conséquence :
 \forall\ P \in E ,\ \overrightarrow {P P\ } = \vec 0 \,
qui peut aussi se formuler :
 \forall\ ( P , Q ) \in E^2 ,\ [ \ P = Q \ ] \Rightarrow [ \ \overrightarrow {P Q\ } = \vec 0 \ ] \,


Il existe une variante équivalente de cette définition où la propriété C2a est remplacée par :

  • C4 :   tout bipoint dont l'image par φ est le vecteur nul est de la forme ( P , P ) :
 \forall\ ( P , Q ) \in E^2 ,\ [ \ \overrightarrow {P Q\ } = \vec 0 \ ] \Rightarrow [ \ P = Q \ ] \,
Cette propriété est l'implication réciproque de la conséquence de C3 ci-dessus.

[modifier] Définition « algébrique »

Une autre définition courante repose sur la relation opposée à la RTID de φ, relation ternaire de E × V dans E. Cette relation est notée habituellement \ ^{\ddot +} \, ( notation dite de Grassmann ).

Là encore, pour que ce "transport" fonctionne, il faut :

  • d'une part, que l'on puisse "passer" des vecteurs aux points et vice versa sans problème; cela revient à exiger :
  • que \ ^{\ddot +} \, soit une application, donc une loi externe,
  • et que sa RTID, relations de E × E dans V, soit aussi une application, donc une loi scalaire;
  • et d'autre part, que l'on dispose d'une formule permettant le transport proprement dit : ici, c'est l' exo-associativité de \ ^{\ddot +} \, par rapport à l'addition dans V, formule équivalente à la relation de Chasles précédente.

Nous déduisons de ces contraintes la définition détaillée suivante :

Un espace affine est un ensemble E muni d'une relation ternaire externe dans E à opérateurs à droite dans V ( c'est-à-dire d'une correspondance de E×V dans E ), que nous noterons « \ ^{\ddot +} \, » , et qui vérifie les propriétés suivantes :

  • L1 :   \ ^{\ddot +} \, est une application, donc une loi externe; cette propriété peut se scinder en deux parties :
  • L1a :   \ ^{\ddot +} \, est fonctionnelle (c'est donc une fonction) :
Chaque couple formé d'un point de E et d'un vecteur de V a au plus une image par \ ^{\ddot +} \, dans E :
 \forall\ ( P , Q , R ) \in E^3 , \forall\ \vec u \in V ,\ [ \ ( P , \vec u ) \ddot + Q \wedge ( P , \vec u ) \ddot + R \ ] \Rightarrow [ Q = R \ ] \,
Nous pouvons dès lors simplifier les énoncés en utilisant à partir d'ici une notation fonctionnelle infixée pour \ ^{\ddot +} \, :
\ [ \ ( P , \vec u ) \ddot + Q \ ] \rightarrow [ \ Q = P \ \ddot + \ \vec u \ ] \,
  • L1b :   \ ^{\ddot +} \, est applicative :
Chaque couple formé d'un point de E et d'un vecteur de V a au moins une image par \ ^{\ddot +} \, dans E :
 \forall\ P \in E , \forall\ \vec u \in V , \exists\ Q \in E \, ,\ Q = P \ \ddot + \ \vec u \,
  • L2 :   la RTID de \ ^{\ddot +} \, est une loi scalaire ; cette propriété se décompose en deux parties :
  • L2a : la RTID de \ ^{\ddot +} \, est fonctionnelle   ( ou, ce qui revient au même, \ ^{\ddot +} \, est régulière à gauche ) :
Si deux vecteurs de V « ajoutés » au même point de E donnent le même résultat dans E, alors ces deux vecteurs sont les mêmes :
 \forall\ ( \vec u , \vec v ) \in V^2 , \forall\ P \in E , [ \ P \ \ddot + \ \vec u = P \ \ddot + \ \vec v \ ] \Rightarrow [ \ \vec u = \vec v \ ] \,
  • L2b :   la RTID de \ ^{\ddot +} \, est applicative :
Pour tout bipoint de E2, il existe un vecteur de V qui, « ajouté » à son origine, donne son extrêmité :
 \forall\ ( P , Q ) \in E^2 , \exists\ \vec u \in V \, ,\ P \ \ddot + \ \vec u = Q \,
  • L3 :   \ ^{\ddot +} \, est exo-associative par rapport à l'addition dans V , \ ^{\dot +} \, :
« ajouter » successivement deux vecteurs de V à un point de E revient à lui « ajouter » leur somme :
 \forall\ P \in E , \forall\ ( \vec u , \vec v ) \in V , ( P \ \ddot + \ \vec u ) \ \ddot + \ \vec v = P \ \ddot + \ ( \vec u \dot + \vec v ) \,


Il existe une variante équivalente de cette définition où la propriété L2a est remplacée par :

Le seul vecteur de V qui, « ajouté » à un point de E, redonne ce même point est le vecteur nul :
 \forall\ \vec u \in V , \forall\ P \in E ,\ [ \ P \ \ddot + \ \vec u = P \ ] \Rightarrow [ \ \vec u = \vec 0 \ ] \,

[modifier] Définition « géométrique »

Un autre point de vue consiste à considérer chaque vecteur de V comme paramètre d'une relation binaire dans E. En d'autres termes, on change d'intermédiaire pour le transport de la structure de V vers E : on passe par les relations binaires dans E, au lieu de passer par le carré cartésien de E.

V est un espace vectoriel. Il comporte donc deux lois, externe et interne. La loi interne forme un groupe, le groupe additif de V. Il s'agit, dans un premier temps, de transférer cette structure de groupe vers l'ensemble des relations binaires dans E, noté Rel2 ( E ). Il parait naturel d'utiliser comme loi destination la composition, qui forme un monoïde avec Rel2 ( E ). Cependant les seules relations binaires susceptibles de former un groupe avec cette loi sont les bijections d'un ensemble dans lui-même. En effet, une relation binaire n'a de symétrique pour la composition que si elle est fonctionnelle, applicative, injective et surjective, c'est-à-dire qu'elle doit être une bijection (voir « Opération sur des correspondances »).

C'est pourquoi dans la suite, nous ne considérerons que Bij( E ), ensemble des bijections de E dans E, qui forme effectivement un groupe pour la composition, appelé groupe symétrique de E. Mais attention : le transfert ne concernera pas forcément tout ce groupe; il pourra se limiter à un sous-groupe.

Pour ce transfert, il nous faudra un morphisme de groupe. Il faudra ajouter à ce morphisme les conditions nécessaires pour que :

  • le transfert de structure se prolonge de Bij( E ) vers E;
  • la loi externe (ne l'oublions pas!) soit elle aussi transférée.


Nous obtenons ainsi la définition détaillée suivante :

Un espace affine est un ensemble E muni d'une correspondance de V dans Bij( E ), que nous noterons « T » , et qui vérifie les propriétés suivantes :

  • T1 :   T est une action sur E, c'est-à-dire une application de V dans Bij( E ) ; cette propriété peut se scinder en deux parties :
  • T1a :   T est fonctionnelle (c'est une fonction) :
A tout vecteur de V, T fait correspondre au plus une bijection :
 \forall\ \vec u \in V , \forall\ ( t_1 , t_2 ) \in Bij^2(E) ,\ [ \ \vec u \ \top\ t_1 \wedge \vec u \ \top\ t_2 \ ] \Rightarrow [ \ t_1 = t_2 \ ] \,
Nous pouvons dès lors simplifier les énoncés en utilisant à partir d'ici une notation fonctionnelle pour T :
\ [ \ \vec u \ \top\ t \ ] \rightarrow [ \ t = \top ( \vec u ) \ ] \,
  • T1b :   T est applicative :
A tout vecteur de V correspond au moins une bijection :
 \forall\ \vec u \in V , \exists\ t \in Bij(E) ,\ t = \top ( \vec u ) \,
  • T2 :   T est opérative;
L'image par T de la somme de deux vecteurs de V est la composée des images de ces deux vecteurs :
 \forall\ ( \vec u , \vec v ) \in V^2 ,\ [ \ T ( \vec u \dot + \vec v ) = T ( \vec u ) \circ T ( \vec v ) \ ] \,
Ainsi, T est un morphisme de groupe, du groupe additif de V vers le groupe des bijections de E dans E muni de la composition des applications, ou vers l'un de ses sous-groupes.
  • T3 :   T est fidèle (ou injective) :
Si deux vecteurs de V ont la même image, alors ils sont égaux :
 \forall\ ( \vec u , \vec v ) \in V^2 ,\ [ \ T ( \vec u ) = T ( \vec v ) \ ] \Rightarrow [ \ \vec u = \vec v \ ] \,
  • T4 :   T est transitive :
Pour tout bipoint de E2, il existe un vecteur dans V dont l'image associe l'extrêmité du bipoint à son origine :
 \forall\ ( P , Q ) \in E^2 , \exists\ \vec u \in V ,\ T ( \vec u ) ( P ) = Q \,


L'image par T d'un vecteur  \vec u est appelée translation dans E de vecteur  \vec u , et notée habituellement «  t_{\vec u} \, ». Les translations de E forment un sous-groupe du groupe des bijections dans E.

En résumé, T permet aux vecteurs de V d'« agir » sur les points de E sous forme de translations. Ainsi, V définit sur E par l'intermédiaire de T une géométrie ... affine.


On montre aisément que les trois définitions précédentes sont équivalentes entre elles. En fait, dès que l'on a muni un ensemble de l'une des trois applications précédentes (avec les propriétés indiquées), on y dispose des deux autres, et on a :

 \forall\ ( P , Q ) \in E^2 , \forall\ \vec u \in V ,\ [ Q = t_{\vec u} ( P ) ] \Leftrightarrow [ \ Q = P \ \ddot + \ \vec u \ ] \Leftrightarrow [  \ \vec u = \overrightarrow {P Q\ } \ ] \,

[modifier] Voir aussi