Hypercube OLAP

Un article de Wikipédia, l'encyclopédie libre.

Cet article est une ébauche concernant l’informatique.

Vous pouvez partager vos connaissances en l’améliorant. (Comment ?).

Un hypercube OLAP (ou cube OLAP) est une représentation abstraite d'informations multidimensionnelles exclusivement numérique utilisé par l'approche OLAP (acronyme de On-line Analytical Processing). Cette structure est prévue à des fins d'analyses interactives par une ou plusieurs personnes (souvent ni informaticiens ni statisticiens) du métier que ces données sont censées représenter.

Les cubes OLAP ont les caractéristiques suivantes :

obtenir des informations déjà agrégées selon les besoins de l’utilisateur.
simplicité et rapidité d’accès
capacité à manipuler les données agrégées selon différentes dimensions
un cube utilise les fonctions classiques d’agrégation : min, max, count, sum, avg, mais peut utiliser des fonctions d’agrégations spécifiques

[modifier] Primitive

L'hypercube OLAP donne accès à des fonctions d'extraction de l'information (pour visualisation, analyse ou traitement), et à des fonctions de requête en langage MDX (comparable à SQL pour une base de données relationnelles).

Rotate : sélection du couple de dimensions à cibler,
Slicing : extraction d'une tranche d'information,
Scoping : extraction d'un bloc de données (opération plus générale que le slicing),
Drill-up : synthèse des informations en fonction d'une dimension (exemple de drill-up sur l'axe temps : passer de la présentation de l'information jour par jour sur une année, à une valeur synthétique pour l'année),
Drill-down : c'est l'équivalent d'un « zoom », opération inverse du drill-up,
Drill-through : lorsqu'on ne dispose que de données agrégées (indicateurs totalisés), le drill through permet d'accéder au détail élémentaire des informations (voir notamment les outils H-OLAP).

[modifier] Implémentation

Le concept de l'hypercube OLAP peut être utilisé par le biais de différentes interfaces selon les besoins et les capacités. Il en existe actuellement quatre.

M-OLAP : La forme la plus classique car la plus rapide. Elle utilise des tables multidimensionnelles pour sauver les informations et réaliser les opérations.
R-OLAP : Celle qui demande le moins d'investissement. Elle travaille sur des tables relationnelles. Une nouvelle table est créée pour contenir chaque agrégat.
H-OLAP (Hybrid OLAP) : Elle utilise à la fois les tables relationnelles pour stocker les informations brutes, et des tables multidimensionnelles pour les agrégats d'informations prédictives.
D-OLAP (Dynamic ou Desktop OLAP)

Voir également la liste d'outils décisionnels.

[modifier] Utilisation

À l'origine utilisés pour une analyse instinctive d'informations, les hypercubes OLAP peuvent être couplés avec des systèmes data mining et ainsi analyser, prédire et simuler plus « strictement » les informations.

Les entreprises génèrent ce type de structure par synchronisations massives d'informations (ETL) à partir de systèmes de gestion de base de données relationnel (SGBDR) de type datamart, datawarehouse ou parfois même transactionnel selon l'architecture qu'ils ont choisie pour leur système d'information décisionnel.

La restitution d'information se fait à l'aide de simples requêteurs utilisant le langage MDX (Multidimensional Expressions), d'Executive Information Systems (EIS), d'applications spécialisées (logiciels d'entreprise), ou dans un tableur (muni d'un plugin de navigation).

[modifier] Exemple

À titre d'illustration, il est possible d'analyser le chiffre d'affaire d'une entreprise dans les 4 dimensions suivantes :

Géographie : continent > pays > région > département > ville
Temps : année > trimestre > mois > semaine > jour
Gamme de produits : gamme > type > famille > référence
Organisation : département > secteur > responsable > vendeur

Il est possible de trouver une documentation fournie sur le langage MDX sur certains sites présentant de la documentation en ligne. Le site MSDN France donne de bonnes bases d'information concernant ce langage : [1].

[modifier] Voir aussi

Base de données relationnelle
Métadonnée
Une représentation graphique multidimensionnelle ne requérant pas l’agrégation (source d’imprécision) : Iconographie des corrélations.