Arbre phylogénétique

Un article de Wikipédia, l'encyclopédie libre.

Un arbre phylogénétique est un arbre schématique qui montre les relations de parentés entre des entités supposées avoir un ancêtre commun. Chacun des nœuds de l'arbre représente l'ancêtre commun de ses descendants ; le nom qu'il porte est celui du clade formé des groupes frères qui lui appartiennent, non celui de l'ancêtre qui reste impossible à déterminer. L'arbre peut être enraciné ou pas, selon qu'on est parvenu à identifier l'ancêtre commun à toutes les feuilles.

Les arbres phylogénétiques ne considèrent pas les transferts horizontaux, et un nouveau modèle se développe en phylogénie, celui de graphe ou réseau phylogénétique qui permet de les prendre en compte, ainsi que les recombinaisons.

Il existe plusieurs techniques de construction des arbres phylogénétiques, plus ou moins rapides et plus ou moins fiables.


Sommaire

[modifier] Définition et méthodes de construction

[modifier] Méthodes

On peut chercher à optimiser plusieurs critères dans l'arbre : la distance, la parcimonie, ou la vraisemblance.

Pour les méthodes de distance, il s'agit tout d'abord de choisir le critère de distance entre les futures feuilles de l'arbre. Par exemple, si ces feuilles sont des séquences d'ADN, on peut choisir comme distance entre deux d'entre elles le nombre de nucléotides qui diffèrent. Pour déterminer cette valeur, on est amené à en effectuer un alignement.
Puis on peut utiliser la méthode UPGMA ou celle du Neighbour Joining pour en déduire l'arbre.

Les méthodes de parcimonie consistent à trouver l'arbre qui minimise le nombre de mutations, délétions, ou insertions ponctuelles pour passer d'une séquence à l'autre. Cette méthode recherche donc le réseau le plus économique en substitutions. Ainsi, si les longueurs des rameaux sont proportionnelles aux nombres de substitutions survenues, le réseau ayant la longueur totale la plus courte sera sélectionné. Ce principe sous entend que les phénomènes de convergence évolutive et de réversibilité (retour d'un caractère à l'état ancestral) soient relativement rares. Ainsi l'arbre présentant le moins d'étapes évolutives est celui qui minimise l'existene de ces deux phénomènes.

Cette méthode est divisée en trois étapes:

  • A rechercher tous les arbres phylogénétiques possibles pour les différents taxa étudiés,
  • B mesurer la longueur totale de chaque arbre,
  • C sélectionner celui ou ceux qui présentent la longueur la plus petite.

Les arbres fournis par cette méthode sont non polarisés, cependant l'utilisation de "Out Groups" (espéces externes aux groupe étudié) permet dans un deuxième temps de polariser l'arbre.

C'est une méthode très lente si l'on génère tous les arbres possibles pour en calculer la parcimonie.

Enfin, les méthodes de vraisemblance sont plus probabilistes. En se fondant sur le taux de substitution pour chaque élément de base (nucléotide pour des séquences d'ADN) au cours du temps, on estime la vraisemblance de la position et de la longueur des branches de l'arbre.

[modifier] Racine

Si l'on a obtenu un arbre non enraciné par une des méthodes ci-dessus, on peut tenter d'en trouver la racine par la méthode de l'outgroup ou du point médian. Celle de l'outgroup consiste à ajouter aux séquences traitées, avant le calcul de l'arbre, une très éloignée : le nœud-racine sera le père de cette séquence. Celle du point médian consiste à affecter à chaque nœud de l'arbre une séquence correspondant au consensus de ses fils, et choisir comme racine le nœud dont la séquence est la plus proche de la séquence consensus de toutes les feuilles.


[modifier] L'arbre phylogénétique du vivant

Arbre phylogénétique très simplifié des groupes d'espèces connues sur terre
Arbre phylogénétique très simplifié des groupes d'espèces connues sur terre

C'est un cas particulier d'arbre phylogénétique : celui des espèces vivantes.

[modifier] Précautions et remarques

[modifier] En débat

Des débats existent entre les systématiciens pour déterminer les critères de classification les plus pertinents. Cette classification, dont une synthèse a paru en français sous le titre : Classification phylogénétique du vivant, est susceptible d'être encore grandement modifiée dans les années à venir, selon toute vraisemblance. La tentative de mise au point des connaissances actuelles en matière de classification mise en place par Guillaume Lecointre et Hervé Le Guyader n'est pas à considérer, comme ils le disent eux-mêmes, comme un document définitif. La 3e édition de leur ouvrage présente déjà une évolution significative par rapport à la première.

L'arbre qui en résulte dans leur ouvrage se trouve à l'article qui en porte le titre.

[modifier] Une ramification à suivre

Un arbre général du vivant cellulaire (sans les virus, donc), se trouve dans une série d'articles à partir de : Eubacteria (classification phylogénétique). Il comporte une ramification développée jusqu'aux niveaux immédiatement supérieurs aux genres, et a été actualisé. Les noms des taxons, sauf exception, y sont portés en latin, conformément aux conventions scientifiques internationales (et à la convention de nommage des taxons supérieurs au genre, dans cette Wikipédia). Il comporte les groupes fossiles, qui augmentent parfois considérablement sa taille, y compris en largeur. C'est donc aussi pour une meilleure lisibilité qu'il a été découpé entre plusieurs articles, selon les taxons les plus « importants ».

[modifier] Classes, ordres et familles ont disparu

Dans ces arbres, « ─o » désigne un « nœud » (lorsqu'il n'a pas encore reçu de nom scientifique, il n'est simplement pas nommé) ou une « branche » terminale (lorsqu'elle n'a pas encore reçu de nom scientifique, elle porte en italique le nom d'un genre représentatif). « ─? » signifie une incertitude sur l'emplacement du clade dans l'arbre, ou sur son existence même comme clade monophylétique. D'ailleurs, tout « nœud » portant plus de deux « branches » signifie déjà une incertitude de l'analyse cladistique.

On notera qu'à chaque « nœud », l'ordre dans lequel on indique les différentes branches n'a pas d'importance autre que graphique : si A et B sont frères, alors B et A aussi ! Un « nœud » ne portant qu'une seule branche n'a pas de sens : lorsque les noms de la classification traditionnelle sont très différents, on a généralement indiqué les deux principaux noms sur la même ligne. On a généralement préféré le nom de l'ordre à celui de la famille lorsqu'ils étaient construits sur la même racine.

[modifier] Contingences

Des noms de taxons, précédemment paraphylétiques (ne comportant pas tous les descendants d'un même ancêtre), ont vu leur acception se restreindre ou s'augmenter, et figurent encore dans l'arbre ; d'autres noms de taxons paraphylétiques ou polyphylétiques ont purement et simplement disparu de la classification phylogénétique (sous réserve de nouvelles analyses), et ne se trouvent plus dans cet arbre, alors même qu'ils restent fréquemment employés, tels les Procaryotes, les Protistes, les Protozoaires, les Actinopodes, les Héliozoaires, les Algues, les Ptéridophytes, les Dicotylédones, les Invertébrés, les Spongiaires ou Porifères, les Sclérosponges, les Cœlentérés, les Poissons, les Agnathes, les Ostracodermes, les Holostéens, les Reptiles, les Ongulés, les Ciconiiformes, les Ptérobranches, les Pseudocœlomates, les Uniramés, les Maxillopodes, les Turbellariés, les Polychètes, etc.

Quelques « petits » taxons (généralement des « sous-familles » ou « familles » de la classification traditionnelle), quoique paraphylétiques, figurent encore dans l'arbre en tant que tels ; il aurait fallu, sinon, « descendre » au niveau des genres, voire des espèces ! Ailleurs, ce sont des pans entiers qui maintiennent par défaut dans nos arbres une classification plus traditionnelle, appelée à être modifiée par des analyses non encore effectuées ou de nouvelles publications...

Des erreurs peuvent par ailleurs avoir été commises, et cet arbre reste en perpétuelle mise à jour ; il n'est pas conseillé de s'y fier. Les liens et références donnés en fin d'articles indiquent des sources réputées fiables, mais parfois contradictoires. Les termes du débat sont aussi explicités dans les différents articles.


[modifier] Voir aussi

[modifier] Liens internes

On consultera aussi les arbres, relativement succincts, édités dans les articles :

[modifier] Arbres par taxon

On trouvera, à l'article Eubacteria (classification phylogénétique) et à l'article Eukaryota (classification phylogénétique), la base de l'arbre phylogénétique du vivant, avec les points de départ vers les articles suivants. Dans cette série d'articles, chaque taxon de niveau supérieur est présenté avec un ou plusieurs arbres résumés, et la partie correspondante de l'arbre général du vivant, ainsi que d'éventuelles hypothèses alternatives, et une bibliographie.

[modifier] Liens externes

[modifier] La méthode

[modifier] L'arbre du vivant

[modifier] Articles

[modifier] Sites internet