Déduplication des données

Définition - Que signifie la déduplication des données?

La déduplication des données est une technique de compression de données dans laquelle des copies redondantes ou répétées de données sont supprimées d'un système. Il est implémenté dans les mécanismes de sauvegarde de données et de données réseau et permet le stockage d'une instance unique de données dans une base de données ou un système d'information (SI).

La déduplication des données est également connue sous le nom de compression intelligente, de stockage d'instance unique, d'affacturage commun ou de réduction de données.

Definir Tech explique la déduplication des données

La déduplication des données fonctionne en analysant et en comparant les segments de données entrants avec les données précédemment stockées. Si des données sont déjà présentes, les algorithmes de déduplication de données ignorent les nouvelles données et créent une référence. Par exemple, si un fichier de document est sauvegardé avec des modifications, le fichier précédent et les modifications appliquées sont ajoutés au segment de données. Toutefois, s'il n'y a aucune différence, le fichier de données le plus récent est ignoré et une référence est créée. De même, un algorithme de déduplication de données analyse les données sortantes sur une connexion réseau pour rechercher les doublons, qui sont supprimés pour augmenter la vitesse de transfert des données.