Arbre (informatique)

Un article de Wikipédia, l'encyclopédie libre.

Pour les articles homonymes, voir Arbre (homonymie) .

Sommaire

[modifier] Généralités

En informatique, un arbre est une structure de données récursive générale, représentant un arbre au sens mathématique. C'est un cas particulier de graphe qui n'a qu'une seule source et aucun cycle.

Dans un arbre, on distingue deux catégories d'éléments :

  • les feuilles, éléments ne possédant pas de fils dans l'arbre ;
  • les nœuds internes, éléments possédant des fils (sous-branches).

La racine de l'arbre est le nœud ne possédant pas de parent.

La hauteur d'un arbre est la longueur du plus grand chemin de la racine à une feuille.

Chaque nœud possède une étiquette, qui est en quelque sorte le « contenu » de l'arbre. L'étiquette peut être très simple: un nombre entier, par exemple. Elle peut également être aussi complexe que l'on veut : un objet, une instance d'une structure de données, un pointeur, etc. Il est presque toujours obligatoire de pouvoir comparer les étiquettes selon une relation d'ordre total, afin d'implanter les algorithmes sur les arbres.

Par exemple, les dossiers de Windows 98 et MS-DOS forment un arbre.

Les arbres sont en fait rarement utilisés en tant que tels, mais de nombreux types d'arbres avec une structure plus restrictive existent et sont couramment utilisés en algorithmique, notamment pour gérer des bases de données, ou pour l'indexation de fichiers. Ils permettent alors des recherches rapides et efficaces. Nous vous en donnons ici les principaux exemples :

[modifier] Construction

Pour construire un arbre à partir de cases ne contenant que des informations, on peut procéder de l'une des trois façons suivantes :

  1. Créer une structure de données composée de :
    1. l'étiquette (la valeur contenue dans le nœud),
    2. un lien vers chaque nœud fils,
    3. un arbre particulier, l'arbre vide, qui permettra de caractériser les feuilles. Une feuille a pour fils des arbres vides uniquement.
  2. Créer une structure de données composée de :
    1. l'étiquette (la valeur contenue dans le nœud),
    2. un lien vers le « premier » nœud fils (nœud fils gauche le cas échéant),
    3. un autre lien vers le nœud frère (le « premier » nœud frère sur la droite le cas échéant).
  3. Créer une structure de données composée de :
    1. l'étiquette (la valeur contenue dans le nœud),
    2. un lien vers le nœud père.

On note qu'il existe d'autres types de représentation propres à des cas particuliers d'arbres. Par exemple, le tas est représenté par un tableau d'étiquettes.

[modifier] Parcours

Arbre d'exemple pour les parcours d'arbre
Arbre d'exemple pour les parcours d'arbre

[modifier] Parcours en largeur

Le parcours en largeur correspond à un parcours par niveau de nœuds de l'arbre. Un niveau est un ensemble de nœuds internes ou[1] de feuilles situés à la même « distance »[2] du nœud racine — on parle aussi de nœud ou de feuille de même hauteur dans l'arbre considéré. L'ordre de parcours d'un niveau donné est habituellement conféré, de manière récursive, par l'ordre de parcours des nœuds parents — nœuds du niveau immédiatement supérieur.

Ainsi, si l'arbre précédent est utilisé, le parcours sera A, B, C, D, E, F puis G.

  1. Le « ou » est large : un niveau peut recouvrir à la fois des nœuds et des feuilles ; en effet, toutes les feuilles d'un arbre ne sont pas nécessairement situées à la même « distance » du nœud racine.
  2. La notion de distance est relative dans ce contexte : elle correspond usuellement au nombre d'arcs — ou d'arêtes — composant le plus court chemin depuis le nœud racine jusqu'au nœud considéré, interne ou feuille. En théorie, elle peut être plus élaborée. Un arbre étant un graphe particulier, ses arcs ou arêtes peuvent être pondérés. Cette pondération peut servir à l'évaluation d'une mesure entre deux nœuds quelconques de l'arbre. On parle de longueur du (plus court) chemin entre deux nœuds d'un arbre, la longueur étant distincte de la différence des hauteurs respectives.

[modifier] Parcours en profondeur

Le parcours en profondeur est un parcours récursif sur un arbre. Il existe trois ordres pour cette méthode de parcours.

[modifier] Parcours en profondeur préfixé

Dans ce mode de parcours, le nœud courant est traité avant le traitement des nœuds gauches et droits. Ainsi, si l'arbre précédent est utilisé, le parcours sera A, B, D, E, C, F puis G.

[modifier] Parcours en profondeur infixé

Dans ce mode de parcours, le nœud courant est traité entre le traitement des nœuds gauches et droits. Ainsi, si l'arbre précédent est utilisé, le parcours sera D, B, E, A, F, C puis G.

[modifier] Parcours en profondeur suffixé

Dans ce mode de parcours, le nœud courant est traité après le traitement des nœuds gauches et droits. Ainsi, si l'arbre précédent est utilisé, le parcours sera D, E, B, F, G, C puis A. Ce mode de parcours correspond à une notation polonaise inversée.

[modifier] Exemples d'arbres

wikt:

Voir « arbre » sur le Wiktionnaire.