Tableau associatif

Un article de Wikipédia, l'encyclopédie libre.

En informatique, un tableau associatif (aussi appelé dictionnaire ou table d'association) est un type abstrait de données composé d'un ensemble fini de clefs et d'un ensemble fini de valeurs, où chaque clef est associée à une valeur. La notion de tableau associatif est donc proche de celle de fonction à domaine fini en mathématiques.

Du point de vue du programmeur, le tableau associatif peut être vu comme une généralisation du tableau : alors que le tableau traditionnel associe des entiers consécutifs à des valeurs d'un certain type, le tableau associatif associe des valeurs d'un type arbitraire à des valeurs d'un autre type.

Les opérations usuellement fournies par un tableau associatif sont :

  • ajout : association d'une nouvelle valeur à une nouvelle clef ;
  • modification : association d'une nouvelle valeur à une ancienne clef ;
  • suppression : suppression d'une clef ;
  • recherche : détermination de la valeur associée à une clef, si elle existe.

Sommaire

[modifier] Exemples

On peut voir un annuaire téléphonique comme un tableau associatif, où les noms constituent les clefs et les numéros de téléphone les valeurs. Un autre exemple est celui d'un dictionnaire (au sens traditionnel), où les mots sont les clefs et les définitions les valeurs. Une base de données peut être également vue comme une généralisation de la notion de tableau associatif.

[modifier] Structures de données pour les tableaux associatifs

Les tableaux associatifs sont le plus souvent utilisés lorsque l'opération de recherche est la plus fréquente. Pour cette raison, la conception privilégie le plus souvent cette opération, au détriment de l'efficacité de l'ajout et de l'occupation mémoire par rapport d'autres structures de données (telles que les listes d'association). Dans de rares cas, un tableau associatif peut être implémenté à un niveau matériel (voir mémoire adressable par contenu).

[modifier] Représentations efficaces

Il y a principalement deux structures de données pour représenter les tableaux associatifs : la table de hachage et l'arbre équilibré. Les avantages et inconvénients respectifs de ces deux solutions sont les suivants :

  • Les tables de hachage ont une meilleure complexité en moyenne pour l'insertion et la recherche (O(1)), alors que les arbres équilibrés ont une meilleure complexité dans le pire des cas (O(log(n)), au lieu de O(n) pour les tables de hachage).
  • Les tables de hachage ont une représentation mémoire généralement plus compacte.
  • Les arbres équilibrés peuvent aisément fournir des structures de données persistantes, ce qui est particulièrement mis en avant dans la programmation fonctionnelle.
  • Les tables de hachage nécessitent la définition d'une bonne fonction de hachage, ce qui peut être difficile à réaliser dans certains cas, alors que les arbres équilibrés ne demandent d'un ordre total sur les clefs. Inversement, les tables de hachages peuvent être utilisées sur des clefs non ordonnées.
  • Les arbres équilibrés préservent l'ordre des clefs, permettant notamment d'effectuer un parcours des clefs dans l'ordre ou de localiser efficacement une clé proche d'une valeur donnée. Les tables de hachage, en revanche, ne préservent pas l'ordre des clefs (lorsqu'il existe).

[modifier] Listes d'association

Une manière simple, mais généralement inefficace, de réaliser un tableau associatif consiste à utiliser une liste d'association, c'est-à-dire une liste chaînée de paires clef-valeur. La recherche consiste alors à parcourir la liste jusqu'à trouver une clef donnée ; elle est donc de complexité O(n). Bien qu'inefficace en général, la liste d'association possède cependant les avantages suivants :

  • Aucune fonction sur les clefs n'est nécessaire (telle qu'une relation d'ordre ou une fonction de hachage).
  • L'ajout est réalisé en temps constant (lorsqu'il est effectué en tête de liste).
  • Pour de très petits tableaux associatifs, les listes d'associations peuvent utiliser moins de ressources que d'autres structures de données.

[modifier] Représentations spécialisées

Si les clefs ont un type particulier, il est parfois possible d'obtenir de meilleurs performances en utilisant une structure de données spécialisée. Par exemple, il est possible d'utiliser un arbre de Patricia si les clefs sont des entiers (lorsque les clefs sont trop clairsemées pour qu'un tableau traditionnel puisse être utilisé). D'une manière plus générale, un trie peut être utilisé dès que les clefs ont une structure de mots. On évite alors de nombreuses comparaisons lorsque plusieurs clefs ont des préfixes communs, ce qui est le cas par exemple dans les tables de routage.

[modifier] Support dans les langages de programmation

[modifier] PHP

Code source PHP utilisant un tableau associatif :

$dico = array( "lundi"=>"dodo",
               "mardi"=>"dodo",
               "mercredi"=>"resto"  );
echo $dico["lundi"];
foreach($dico as $key=>$value)
{
    echo "Le $key c'est $value.";
}

Sortie écran :

dodo
Le lundi c'est dodo
Le mardi c'est dodo
Le mercredi c'est resto

[modifier] C++

Code source C++ utilisant un tableau associatif via la classe map de la bibliothèque standard :

#include <map>
#include <string>
using namespace std;
 
int main()
{
   map <string, string> repertoire;
   repertoire["Jean Dupont"]     = "01.02.03.04.05";
   repertoire["François Martin"] = "02.03.04.05.06";
   repertoire["Louis Durand"]    = "03.04.05.06.07";
   return 0;
}

Le tableau associatif ci-dessus est aussi appelé dictionnaire notamment parce qu'il permet de faire des recherches rapides, sans parcourir le tableau entier.

[modifier] Objective Caml

Le langage Objective Caml fournit trois sortes de tableaux associatifs dans sa bibliothèque standard. La plus simple est une liste de paires :

# let m = ["Sally Smart", "555-9999";
           "John Doe", "555-1212";
           "J. Random Hacker", "553-1337"];;
val m : (string * string) list =
  [("Sally Smart", "555-9999"); ("John Doe", "555-1212");
   ("J. Random Hacker", "553-1337")]
# List.assoc "John Doe" m;;
- : string = "555-1212"

La seconde est une table de hachage polymorphe :

# let m = Hashtbl.create 3;;
val m : ('_a, '_b) Hashtbl.t = <abstr>
# Hashtbl.add m "Sally Smart" "555-9999";
  Hashtbl.add m "John Doe" "555-1212";
  Hashtbl.add m "J. Random Hacker" "553-1337";;
- : unit = ()
# Hashtbl.find m "John Doe";;
- : string = "555-1212"

Enfin, la dernière est un dictionnaire purement applicatif (réalisé par des arbres AVL) :

# include (Map.Make(String));;
...
# let m = add "Sally Smart" "555-9999" empty
  let m = add "John Doe" "555-1212" m
  let m = add "J. Random Hacker" "553-1337" m;;
val m : string t = <abstr>
# find "John Doe" m;;
- : string = "555-1212"

Les listes de paires et les dictionnaires sont des structures de données persistantes, car purement fonctionnelles. Les tables de hachage sont au contraire des structures de données impératives, de meilleure efficacité que les listes et les AVL en général.