Données semi-structurées

Définition - Que signifient les données semi-structurées?

Les données semi-structurées sont des données qui ne sont ni des données brutes, ni des données typées dans un système de base de données conventionnel. Ce sont des données structurées, mais elles ne sont pas organisées dans un modèle rationnel, comme un tableau ou un graphique basé sur des objets. De nombreuses données trouvées sur le Web peuvent être qualifiées de semi-structurées. L'intégration des données utilise en particulier des données semi-structurées.

Definir Tech explique les données semi-structurées

Quelques exemples de données semi-structurées seraient des fichiers BibTex ou un document SGML (Standard Generalized Markup Language). Les fichiers semi-structurés peuvent contenir des données rationnelles constituées d'enregistrements, mais ces données peuvent ne pas être organisées dans une structure reconnaissable. Certains champs peuvent être manquants ou contenir des informations qui ne peuvent pas être facilement décrites dans un système de base de données.

Dans les données semi-structurées, les informations contenues dans les données sont normalement associées à un schéma de base de données. C'est pourquoi l'information est parfois appelée auto-descriptive.