Définition - Que signifie Extract Transform Load (ETL)?
Extract transform load (ETL) est le processus d'extraction, de transformation et de chargement lors de l'utilisation de la base de données, mais en particulier lors de l'utilisation du stockage de données. Il comprend les sous-processus suivants:
- Récupération de données à partir de sources de stockage ou de transmission de données externes
- Transformer les données dans un format compréhensible, où les données sont généralement stockées avec un code de détection et de correction d'erreur pour répondre aux besoins opérationnels
- Transmission et chargement de données à l'extrémité de réception
Definir Tech explique Extract Transform Load (ETL)
La première phase d'un processus ETL se concentre sur la récupération des données à partir de la source de stockage. La plupart des projets de stockage de données intègrent des données reçues de divers systèmes sources. Chaque système individuel peut utiliser une organisation ou un format de données distinct. Les structures de source de données courantes sont les bases de données relationnelles et les fichiers de données purs. Ils peuvent également inclure des modèles de bases de données non relationnelles comme les systèmes de gestion de l'information ou d'autres structures de données comme la méthode d'accès au stockage virtuel (VSAM) ou la méthode d'accès séquentiel indexé (ISAM). Les sources de données peuvent même inclure des sources externes telles que des données provenant d'Internet ou via un système d'analyse.
La phase de transformation utilise une série de règles ou d'opérations pour récupérer des données pures à partir de la source afin de fournir les données dans leur forme finale à des fins de manipulation à l'extrémité de réception. Certaines sources de données nécessitent très peu ou même pas de traitement de données. Parfois, une ou plusieurs transformations peuvent être essentielles pour répondre aux exigences commerciales et techniques de la base de données cible.
L'étape de chargement ou de transmission vise à envoyer des données à l'extrémité de réception, qui est susceptible d'être un stockage de données. Selon les besoins de l'application, ce processus peut être très simple ou très compliqué. Certaines méthodes de stockage de données peuvent remplacer les anciennes données par des données cumulatives. La mise à jour des données extraites est normalement effectuée périodiquement.