Étoile (modèle de données)

Un article de Wikipédia, l'encyclopédie libre.

Pour les articles homonymes, voir étoile (homonymie).

Dans les datawarehouse ou datamart, le modèle de données « en étoile » est typique des structures multidimensionnelles stockant des données atomiques ou agrégées.

Le modèle en étoile est optimisé pour les requêtes d'analyse et souvent considéré (à tort) comme un modèle dénormalisé. Le modèle en étoile est implémenté sur un SGBD relationnel classique (par exemple Oracle,IBM DB2, SQL_Server, Teradata).

La table située au centre de l'étoile est la table des faits ou mesures (ou encore métriques) : ce sont les éléments mesurés dans l'analyse comme les montants, les quantités, les taux, etc.

Les tables situées aux extrémités de l'étoile sont les tables de dimensions (ou encore axes d'analyse) ou niveaux de suivi. Ce sont les dimensions explorées dans l'analyse comme par exemple le temps (jour, mois, période, ...), la nomenclature des produits (référence, famille, ...), la segmentation clientèle (tranche d'âge, marché, ...), etc.

Le principe d'optimisation de ce modèle en étoile est le suivant : une clé calculée "technique" (clé générique) sert de jointure relationnelle entre les tables de dimensions et la table des faits. La requête SQL réalise d'abord sa sélection sur les tables de dimensions (peu volumineuses) et ensuite seulement, à partir des clés ainsi sélectionnées, la jointure avec la volumineuse table des faits.

Le modèle de données dit « en flocon » est une variante du modèle en étoile : chaque table de dimension est re-normalisée pour faire apparaître la hiérarchie sous-jacente (nomenclature, ...).