UPGMA

Un article de Wikipédia, l'encyclopédie libre.

UPGMA (Unweighted Pair Group Method with Arithmetic mean) est le nom d'un algorithme destiné à la construction d'un arbre phylogénétique. Cette méthode permet la transformation d'une matrice de distances (entre différents organismes, populations, ou séquences de nucléotides) en un arbre enraciné.

La matrice fournit l'ensemble des distances entre toutes les paires d'éléments. L'algorithme fonctionne par itérations successives, qui réduisent progressivement la taille de la matrice. Chaque itération voit le regroupement des deux éléments restants séparés par la plus faible distance: ces éléments sont associés dans l'arbre, et sont remplacés par un élément « consensus ». Les nouvelles distances entre cet élément consensus et les éléments restants dans la matrice sont recalculées par la moyenne arithmétique des deux éléments regroupés.

Cette méthode simple et rapide présente toutefois de nombreux biais. En particulier, elle suppose que la vitesse d'évolution est constante dans toutes les branches. Par conséquence, si une branche « interne » évolue beaucoup plus vite que toutes les autres, elle ne sera rattachée au reste de l'arbre qu'à la dernière étape et sera à l'extérieur de l'arbre (le phénomène est similaire à l'attraction des longues branches).

Les défauts de l'UPGMA sont tels que l'algorithme n'a plus qu'un intérêt historique. Il a en effet été remplacé depuis lors par des méthodes plus avancées (comme le Neighbour Joining ou la parcimonie dans un premier temps, puis les techniques de maximum de vraisemblance ou algorithmes bayesiens utilisés aujourd'hui en phylogénie).

Autres langues