Déduplication post-traitement (ppd)

Définition - Que signifie la déduplication post-traitement (PPD)?

La déduplication post-processus (PPD) fait référence à un système dans lequel les processus logiciels filtrent les données redondantes d'un ensemble de données après leur transfert vers un emplacement de stockage de données. Cela peut également être appelé déduplication asynchrone et est souvent utilisé lorsque les responsables considèrent qu'il est inefficace ou impossible de supprimer les données redondantes avant ou pendant le transfert.

Definir Tech explique la déduplication post-traitement (PPD)

La déduplication post-processus peut être comparée à une pratique appelée déduplication en ligne où les données redondantes sont retirées lorsque les données sont transférées pour stockage. L'une des raisons pour lesquelles les administrateurs peuvent choisir une approche de déduplication post-processus est lorsque la déduplication en ligne peut ralentir le processus de transfert et rendre plus difficile l'archivage facile et efficace des données.

Bien que les gestionnaires ou les administrateurs puissent trouver plus facile d'utiliser une méthode de déduplication post-processus, ce type d'optimisation des données présente des inconvénients. L'un est le fait que la destination de stockage des données devra disposer de suffisamment d'espace pour s'adapter au plus grand ensemble de données non filtrées. En supposant que les gestionnaires de données disposent d'un stockage suffisant et que l'analyse des données dans le stockage ne pose pas de difficultés techniques, la méthode de déduplication post-processus peut souvent être un moyen souhaitable de nettoyer un ensemble de données pour une utilisation future après qu'il a déjà été soigneusement rangé dans "chambre froide."