Verification des données

Définition - Que signifie la vérification des données?

La vérification des données est le processus de vérification de l'exactitude des données après une migration de données. Il existe différents types de vérification:

  • Vérification complète, où toutes les données sont vérifiées
  • Vérification d'échantillonnage, où un petit échantillon des données est vérifié

La vérification des données peut être à la fois coûteuse et longue à effectuer.

Definir Tech explique la vérification des données

Lorsque les données sont migrées depuis un entrepôt de données pour être utilisées dans un système de traitement de Big Data, les données doivent être vérifiées pour s'assurer qu'elles sont exactes. Tout, des fautes d'orthographe aux chiffres inexacts en passant par la perte de données, pourrait mettre en péril un projet Big Data.

Une méthode de vérification des données consiste à comparer les données dans un système aux données migrées dans l'autre un à un, mais cela peut prendre du temps et les coûts de fonctionnement de deux systèmes peuvent être coûteux.

Il est également possible de vérifier uniquement un sous-ensemble des données, mais un échantillon ne peut pas représenter toutes les données. Les administrateurs doivent peser le compromis entre réduire le temps et les dépenses de vérification des données tout en garantissant l'exactitude. L'automatisation du processus est une solution.