Extension parallèle de datastage (datastage px)

Définition - Que signifie DataStage Parallel Extender (DataStage PX)?

DataStage Parallel Extender (DataStage PX) est un outil d'intégration de données IBM. Il s'agit de l'un des nombreux outils d'extraction, de transformation et de chargement (ETL) largement utilisés dans l'industrie de l'entreposage de données. Cet outil peut collecter des informations à partir de sources hétérogènes, effectuer des transformations selon les besoins d'une entreprise et charger les données dans des entrepôts de données respectifs.

DataStage PX peut également être appelé DataStage Enterprise Edition.

Definir Tech explique DataStage Parallel Extender (DataStage PX)

DataStage Parallel Extender possède une architecture parallèle pour traiter les données. Les deux principaux types de parallélisme implémentés dans DataStage PX sont le parallélisme de pipeline et de partition. La possibilité de traiter les données de manière parallèle accélère le traitement des données dans une large mesure.

DataStage Parallel Extender comprend diverses étapes par lesquelles les données source sont traitées et renforcées dans les bases de données cibles. Ceux-ci sont définis en termes de téraoctets. Outre les étapes, DataStage PX utilise des conteneurs pour réutiliser les composants et séquences de travail afin d'exécuter et de planifier plusieurs travaux en même temps.

Les étapes couramment utilisées dans DataStage Parallel Extender comprennent:

  • transformateur
  • Aggregator
  • Ensemble de données
  • Copier
  • Le changement s'applique
  • modifier
  • Filtre
  • Rejoignez
  • aller
  • Chercher