Concierge de données (data wrangler)

Un concierge de données est un employé des TI qui nettoie les sources de données volumineuses afin de les préparer pour les analystes et les scientifiques des données. Ce poste a été créé pour permettre aux personnes possédant des compétences de haut niveau d'être employées le plus efficacement possible plutôt que sur des travaux qui pourraient être effectués par d'autres. La préparation des données peut représenter plus de 80 % du temps consacré à l'analyse des données. Également connus sous le nom de data wranglers ou data janitors (lutteurs de données), ils effectuent le travail de préparation nécessaire pour rendre possible un traitement et une analyse avancés. Les concierges de données sont chargés d'acquérir, d'organiser, de nettoyer et de consolider des données disparates. Ils facilitent ainsi la collaboration avec les analystes de données et les scientifiques.

Alors que les entreprises informatiques acquièrent et traitent de plus en plus de données, la répartition de la charge de travail est de plus en plus importante pour fournir une analyse de qualité dans les délais. Souvent, ce sont les employés débutants dans le domaine de l'analyse des données qui effectuent ce travail de préparation minutieux. Près d'un tiers (ou plus) de tous les employés de l'intelligence économique peuvent être classés comme des concierges de données. Le terme "concierge de données" ne désigne généralement pas un emploi spécifique, mais plutôt une description. Un employé dont le rôle principal est la préparation des données peut être qualifié d'ingénieur des données.

Vous pouvez également être intéressé
  1. Concierge de données Définition - Que signifie Data Janitor? Un concierge de données est une personne désignée pour prendre de grandes quantités de données volumineuses et les condenser en informations sur lesquelles les entreprises peuvent agir. La plupart des gardiens de données passent leur temps à parcourir de grandes quantités de données et...
  2. Données informatiques (Data) Les données informatiques désignent les informations qui sont stockées ou traitées par des ordinateurs. Les données informatiques peuvent être des documents textuels, des images ou des clips audio. L'unité centrale de l'ordinateur peut traiter les données informatiques et les stocker dans des dossiers et sur son disque dur. Les données...

Les big data ne peuvent pas être traitées avant que les concierges de données aient fait leur travail. Ils préparent les données pour qu'elles puissent être utilisées avec Hadoop, Pig et Hive, Spark, MapReduce et d'autres langages de programmation, tels que Scala, Perl et des langages de calcul statistique tels que R.

  1. La monnaie des données (data as currency) La monnaie des données fait référence à la valeur monétaire que l'on attribue aux données afin de déterminer leur importance financière pour une organisation. Une fois que la valeur monétaire des données est identifiée, elle peut être utilisée comme unité d'échange dans une transaction, soit comme paiement unique, soit en...
  2. Data mining Définition - Que signifie l'exploration de données? L'exploration de données est le processus d'analyse de modèles cachés de données selon différentes perspectives afin de transformer ces données en informations utiles et souvent exploitables. Les données sont collectées et assemblées dans des zones communes, telles que les entrepôts de données, et...