Lutte des données

Définition - Que signifie Data Wrangling?

Le Data Wrangling est un type spécifique de gestion de données qui résulte de nouvelles capacités logicielles introduisant des ensembles de données volumineux, désordonnés et diversifiés qui doivent entrer dans une architecture orientée services (SOA) à des fins d'analyse et d'utilisation. Le traitement des données implique généralement de nombreuses techniques sophistiquées différentes pour traiter des données irrégulières ou diverses et les manipuler pour des cas d'utilisation commerciale.

Definir Tech explique Data Wrangling

Cela peut sembler un terme informel, mais la gestion des données occupe en fait un espace particulier dans la gestion des données. Un moyen utile de comprendre la gestion des données consiste à le comparer à la méthodologie souvent plus formelle d'extraction, de transformation et de chargement (ETL). La gestion des données a des aspects et des cas d'utilisation différents de ceux d'ETL. Cela est souvent effectué par des spécialistes des données qualifiés ou par d'autres personnes proches du pipeline. D'une certaine manière, la gestion des données pourrait être appelée un type d'ETL «open source» dans la mesure où les ingénieurs qui s'occupent des données peuvent être plus «pratiques» ou utiliser des méthodes d'extraction plus manuelles.

Pour ceux qui comprennent vraiment les processus raffinés par lesquels diverses données sont sélectionnées, triées et introduites dans les architectures d'entreprise, la lutte contre les données est en fait un sujet très important. Les professionnels de l'informatique examinent un vaste éventail d'outils, de ressources et de techniques pour valoriser des données brutes, brutes ou non structurées.