Définition - Que signifie le Big Data?
Les mégadonnées font référence à un processus utilisé lorsque les techniques traditionnelles d'exploration et de traitement des données ne peuvent pas révéler les informations et la signification des données sous-jacentes. Les données non structurées, sensibles au temps ou simplement très volumineuses ne peuvent pas être traitées par les moteurs de bases de données relationnelles. Ce type de données nécessite une approche de traitement différente appelée Big Data, qui utilise un parallélisme massif sur du matériel facilement disponible.
Definir Tech explique le Big Data
Tout simplement, les mégadonnées reflètent le monde en évolution dans lequel nous vivons. Plus les choses changent, plus les changements sont capturés et enregistrés sous forme de données. Prenons la météo comme exemple. Pour un prévisionniste météorologique, la quantité de données collectées dans le monde sur les conditions locales est considérable. Logiquement, il serait logique que les environnements locaux dictent les effets régionaux et les effets régionaux dictent les effets mondiaux, mais cela pourrait bien être l'inverse. D'une manière ou d'une autre, ces données météorologiques reflètent les attributs des mégadonnées, où le traitement en temps réel est nécessaire pour une quantité massive de données et où le grand nombre d'entrées peut être généré par la machine, des observations personnelles ou des forces extérieures comme les taches solaires.
Le traitement d'informations comme celui-ci illustre pourquoi le Big Data est devenu si important:
- La plupart des données collectées actuellement ne sont pas structurées et nécessitent un stockage et un traitement différents de ceux des bases de données relationnelles traditionnelles.
- La puissance de calcul disponible est fulgurante, ce qui signifie qu'il y a plus d'opportunités de traiter le Big Data.
- Internet a démocratisé les données, augmentant régulièrement les données disponibles tout en produisant de plus en plus de données brutes.
Les données sous leur forme brute n'ont aucune valeur. Les données doivent être traitées pour être précieuses. Cependant, c'est là que réside le problème inhérent aux mégadonnées. Le traitement des données du format d'objet natif à un aperçu utilisable vaut-il le coût en capital énorme de le faire? Ou y a-t-il trop de données avec des valeurs inconnues pour justifier le pari de les traiter avec des outils Big Data? La plupart d'entre nous conviendraient que le fait de pouvoir prédire le temps aurait de la valeur, la question est de savoir si cette valeur pourrait l'emporter sur les coûts de transformation de toutes les données en temps réel dans un rapport météorologique sur lequel on pourrait compter.