Définition - Que signifie Schéma en lecture?
Schéma à la lecture fait référence à une stratégie d'analyse de données innovante dans les nouveaux outils de traitement des données comme Hadoop et d'autres technologies de base de données plus impliquées. Dans le schéma à la lecture, les données sont appliquées à un plan ou à un schéma lorsqu'elles sont extraites d'un emplacement stocké, plutôt qu'au fur et à mesure qu'elles entrent.
Definir Tech explique le schéma en lecture
Les technologies de base de données plus anciennes avaient une stratégie d'application du schéma à l'écriture - en d'autres termes, les données devaient être appliquées à un plan ou un schéma lorsqu'elles entraient dans la base de données. Cela a été fait en partie pour assurer la cohérence des données, et c'est l'un des principaux avantages du schéma en écriture. Avec le schéma à la lecture, les personnes qui traitent les données peuvent avoir besoin de faire plus de travail pour identifier chaque élément de données, mais il y a beaucoup plus de polyvalence.
De manière fondamentale, la conception schema-on-read complète les principales utilisations de Hadoop et des outils associés. Les entreprises souhaitent regrouper efficacement un grand nombre de données et les stocker pour des utilisations particulières. Cela dit, ils peuvent accorder plus d'importance à la collecte de données impures ou incohérentes qu'à un régime strict de contrôle des données. En d'autres termes, Hadoop peut accepter d'obtenir un large éventail de différents petits morceaux de données qui pourraient ne pas être complètement organisés. Ensuite, à mesure que ces informations sont utilisées, elles s'organisent. L'application de l'ancien système de schéma à l'écriture de la base de données signifierait que les données les moins organisées seraient probablement rejetées.
Une autre façon de dire cela est que le schéma à l'écriture est préférable pour obtenir des ensembles de données très propres et cohérents, mais ces ensembles de données peuvent être plus limités. Le schéma en lecture jette un réseau plus large et permet une organisation plus polyvalente des données. Les experts soulignent également qu'il est plus facile de créer deux vues différentes des mêmes données avec un schéma en lecture.
Cette stratégie de schéma à la lecture est un élément essentiel de la raison pour laquelle Hadoop et les technologies associées sont si populaires dans la technologie d'entreprise d'aujourd'hui. Les entreprises utilisent de grandes quantités de données brutes pour alimenter toutes sortes de processus d'entreprise en appliquant une logique floue et d'autres systèmes de tri et de filtrage impliquant des entrepôts de données d'entreprise et d'autres actifs de données volumineux.