Données non structurées

Définition - Que signifient les données non structurées?

Les données non structurées représentent toutes les données qui n'ont pas de structure reconnaissable. Il est non organisé et brut et peut être non textuel ou textuel. Par exemple, le courrier électronique est une belle illustration des données textuelles non structurées. Il comprend l'heure, la date, les détails et l'objet du destinataire et de l'expéditeur, etc., mais le corps d'un e-mail reste non structuré. Les données non structurées peuvent également être identifiées comme des données à structure lâche, les sources de données comprenant une structure, mais toutes les données d'un ensemble de données ne suivent pas la même structure.

Dans les entreprises centrées sur le client, les données trouvées sous une forme non structurée peuvent être examinées pour améliorer le marketing relationnel et la gestion de la relation client (CRM). À mesure que les applications de médias sociaux, telles que Facebook et Twitter, se généralisent, le développement de données non structurées est susceptible de dépasser les progrès des données structurées.

Definir Tech explique les données non structurées

Les données non structurées font référence aux données qui suivent une forme moins ordonnée que des éléments tels que des pages de feuille de calcul, des tables de base de données ou d'autres ensembles de données linéaires ou ordonnés. En fait, le terme «ensemble de données» est utile car il est associé à des données qui se trouvent dans des tableaux nets et accessibles, sans aucun contenu supplémentaire, et qui sont liées ou étiquetées dans une structure spécifique.

D'autres exemples de données textuelles non structurées incluent des documents Word, des présentations PowerPoint, des messages instantanés, des logiciels de collaboration, des documents, des livres, des publications sur les réseaux sociaux et des dossiers médicaux. Les données non structurées non textuelles sont généralement créées dans des médias, tels que des fichiers audio MP3, des images JPEG et des fichiers vidéo Flash, etc.

Les données non structurées n'incluent généralement pas de modèle de données prédéfini et peuvent ne pas correspondre correctement aux tables relationnelles. Les données non structurées sont généralement lourdes de texte. Cependant, il peut inclure des chiffres et des dates, ainsi que des faits. Cela conduit à des ambiguïtés difficiles à identifier à l'aide de logiciels conventionnels.

Le stockage d'énormes volumes de données non structurées générées au sein d'une entreprise, s'il est mal géré, peut entraîner des dépenses plus élevées. Les données sur papier ou sous format électronique doivent être numérisées pour qu'une application de recherche puisse analyser les idées, en fonction des mots utilisés dans certains contextes. Ceci est connu sous le nom de recherche d'entreprise ou de recherche sémantique.