Cube de données

Définition - Que signifie Data Cube?

Un cube de données fait référence à une plage de valeurs tridimensionnelles (3D) (ou supérieure) qui sont généralement utilisées pour expliquer la séquence temporelle des données d'une image. Il s'agit d'une abstraction de données pour évaluer des données agrégées à partir de divers points de vue. Il est également utile pour la spectroscopie d'imagerie car une image à résolution spectrale est représentée sous la forme d'un volume 3-D.

Un cube de données peut également être décrit comme les extensions multidimensionnelles de tables à deux dimensions. Il peut être considéré comme une collection de tables 2D identiques empilées les unes sur les autres. Les cubes de données sont utilisés pour représenter des données trop complexes pour être décrites par un tableau de colonnes et de lignes. En tant que tels, les cubes de données peuvent aller bien au-delà de la 3D pour inclure beaucoup plus de dimensions.

Definir Tech explique Data Cube

Un cube de données est généralement utilisé pour interpréter facilement les données. Il est particulièrement utile lors de la représentation de données avec des dimensions comme certaines mesures des besoins de l'entreprise. Chaque dimension d'un cube représente certaines caractéristiques de la base de données, par exemple, les ventes quotidiennes, mensuelles ou annuelles. Les données incluses dans un cube de données permettent d'analyser presque tous les chiffres de pratiquement tous les clients, agents de vente, produits et bien plus encore. Ainsi, un cube de données peut aider à établir des tendances et à analyser les performances.

Les cubes de données sont principalement classés en deux catégories:

  • Cube de données multidimensionnel: la plupart des produits OLAP sont développés sur la base d'une structure dans laquelle le cube est modelé comme un tableau multidimensionnel. Ces produits OLAP multidimensionnels (MOLAP) offrent généralement des performances améliorées par rapport à d'autres approches, principalement parce qu'ils peuvent être indexés directement dans la structure du cube de données pour collecter des sous-ensembles de données. Lorsque le nombre de dimensions est supérieur, le cube devient plus clairsemé. Cela signifie que plusieurs cellules qui représentent des combinaisons d'attributs particulières ne contiendront aucune donnée agrégée. Cela augmente à son tour les exigences de stockage, qui peuvent parfois atteindre des niveaux indésirables, rendant la solution MOLAP intenable pour d'énormes ensembles de données aux nombreuses dimensions. Les techniques de compression peuvent aider; cependant, leur utilisation peut endommager l'indexation naturelle de MOLAP.
  • OLAP relationnel: OLAP relationnel utilise le modèle de base de données relationnelle. Le cube de données ROLAP est utilisé comme un ensemble de tables relationnelles (environ deux fois plus que la quantité de dimensions) par rapport à un tableau multidimensionnel. Chacune de ces tables, connue sous le nom de cuboïde, signifie une vue spécifique.