Arbre (informatique)
Un article de Wikipédia, l'encyclopédie libre.
Sommaire |
[modifier] Généralités
En informatique, un arbre est une structure de données récursive générale, représentant un arbre au sens mathématique. C'est un cas particulier de graphe qui n'a qu'une seule source et aucun cycle.
Dans un arbre, on distingue deux catégories d'éléments :
- les feuilles, éléments ne possédant pas de fils dans l'arbre ;
- les nœuds internes, éléments possédant des fils (sous-branches).
La racine de l'arbre est le nœud ne possédant pas de parent.
La hauteur d'un arbre est la longueur du plus grand chemin de la racine à une feuille.
Chaque nœud possède une étiquette, qui est en quelque sorte le « contenu » de l'arbre. L'étiquette peut être très simple: un nombre entier, par exemple. Elle peut également être aussi complexe que l'on veut : un objet, une instance d'une structure de données, un pointeur, etc. Il est presque toujours obligatoire de pouvoir comparer les étiquettes selon une relation d'ordre total, afin d'implanter les algorithmes sur les arbres.
Par exemple, les dossiers de Windows 98 et MS-DOS forment un arbre.
Les arbres sont en fait rarement utilisés en tant que tels, mais de nombreux types d'arbres avec une structure plus restrictive existent et sont couramment utilisés en algorithmique, notamment pour gérer des bases de données, ou pour l'indexation de fichiers. Ils permettent alors des recherches rapides et efficaces. Nous vous en donnons ici les principaux exemples :
- Les arbres binaires dont chaque nœud a au plus deux fils : ils sont en fait utilisés sous forme d'arbres binaires de recherche, de tas, d'AVL, ou encore d'arbres rouge-noir. Les deux derniers exemples sont des cas particuliers d'arbres équilibrés, c'est-à-dire d'arbres dont les sous-branches ont environ la même hauteur.
- Les arbres n-aires qui sont une généralisation des arbres binaires : chaque nœud a au plus n fils. Les arbres 2-3-4 et les arbres B en sont des exemples d'utilisation et sont eux aussi des arbres balancés.
[modifier] Construction
Pour construire un arbre à partir de cases ne contenant que des informations, on peut procéder de l'une des trois façons suivantes :
- Créer une structure de données composée de :
- l'étiquette (la valeur contenue dans le nœud),
- un lien vers chaque nœud fils,
- un arbre particulier, l'arbre vide, qui permettra de caractériser les feuilles. Une feuille a pour fils des arbres vides uniquement.
- Créer une structure de données composée de :
- l'étiquette (la valeur contenue dans le nœud),
- un lien vers le « premier » nœud fils (nœud fils gauche le cas échéant),
- un autre lien vers le nœud frère (le « premier » nœud frère sur la droite le cas échéant).
- Créer une structure de données composée de :
- l'étiquette (la valeur contenue dans le nœud),
- un lien vers le nœud père.
On note qu'il existe d'autres types de représentation propres à des cas particuliers d'arbres. Par exemple, le tas est représenté par un tableau d'étiquettes.
[modifier] Parcours
[modifier] Parcours en largeur
Le parcours en largeur correspond à un parcours par niveau de nœuds de l'arbre. Un niveau est un ensemble de nœuds internes ou[1] de feuilles situés à la même « distance »[2] du nœud racine — on parle aussi de nœud ou de feuille de même hauteur dans l'arbre considéré. L'ordre de parcours d'un niveau donné est habituellement conféré, de manière récursive, par l'ordre de parcours des nœuds parents — nœuds du niveau immédiatement supérieur.
Ainsi, si l'arbre précédent est utilisé, le parcours sera A, B, C, D, E, F puis G.
- ↑ Le « ou » est large : un niveau peut recouvrir à la fois des nœuds et des feuilles ; en effet, toutes les feuilles d'un arbre ne sont pas nécessairement situées à la même « distance » du nœud racine.
- ↑ La notion de distance est relative dans ce contexte : elle correspond usuellement au nombre d'arcs — ou d'arêtes — composant le plus court chemin depuis le nœud racine jusqu'au nœud considéré, interne ou feuille. En théorie, elle peut être plus élaborée. Un arbre étant un graphe particulier, ses arcs ou arêtes peuvent être pondérés. Cette pondération peut servir à l'évaluation d'une mesure entre deux nœuds quelconques de l'arbre. On parle de longueur du (plus court) chemin entre deux nœuds d'un arbre, la longueur étant distincte de la différence des hauteurs respectives.
[modifier] Parcours en profondeur
Le parcours en profondeur est un parcours récursif sur un arbre. Il existe trois ordres pour cette méthode de parcours.
[modifier] Parcours en profondeur préfixé
Dans ce mode de parcours, le nœud courant est traité avant le traitement des nœuds gauches et droits. Ainsi, si l'arbre précédent est utilisé, le parcours sera A, B, D, E, C, F puis G.
[modifier] Parcours en profondeur infixé
Dans ce mode de parcours, le nœud courant est traité entre le traitement des nœuds gauches et droits. Ainsi, si l'arbre précédent est utilisé, le parcours sera D, B, E, A, F, C puis G.
[modifier] Parcours en profondeur suffixé
Dans ce mode de parcours, le nœud courant est traité après le traitement des nœuds gauches et droits. Ainsi, si l'arbre précédent est utilisé, le parcours sera D, E, B, F, G, C puis A. Ce mode de parcours correspond à une notation polonaise inversée.
[modifier] Exemples d'arbres
- Les arbres binaires;
- Les arbres B (B-Tree);
- Les arbres équilibrés;
- Les arbres syntaxiques;
- Les tas;
- Les arbres couvrants;
- Les octrees;
- Les Arbres AVL;
- Les Arbres bicolore.