Définition - Que signifie le profilage des données?
Le profilage des données est une technique utilisée pour examiner les données à des fins différentes, telles que la détermination de l'exactitude et de l'exhaustivité. Ce processus examine une source de données telle qu'une base de données pour découvrir les zones erronées dans l'organisation des données. Le déploiement de cette technique améliore la qualité des données.
Le profilage des données est également appelé découverte de données.
Definir Tech explique le profilage des données
Le profilage des données est la méthode d'examen des données disponibles dans une source de données et de collecte de statistiques et d'informations sur ces données. Ces statistiques aident à identifier l'utilisation et la qualité des données des métadonnées. Cette méthode est largement utilisée dans l'entreposage de données d'entreprise.
Le profilage des données clarifie la structure, la relation, le contenu et les règles de dérivation des données, ce qui aide à comprendre les anomalies dans les métadonnées. Le profilage des données utilise différents types de statistiques descriptives, notamment la moyenne, le minimum, le maximum, le centile, la fréquence et d'autres agrégats tels que le nombre et la somme. Les informations de métadonnées supplémentaires obtenues lors du profilage sont le type de données, la longueur, les valeurs discrètes, l'unicité et la reconnaissance de type abstrait.