Lac de données

Définition - Que signifie Data Lake?

Un lac de données est un référentiel centralisé massif, facilement accessible, de grands volumes de données structurées et non structurées.

Definir Tech explique Data Lake

L'architecture du lac de données est une approche de tout stockage du Big Data. Les données ne sont pas classées lorsqu'elles sont stockées dans le référentiel, car la valeur des données n'est pas claire au départ. En conséquence, la préparation des données est éliminée. Un data lake est donc moins structuré qu'un data warehouse classique. Lorsque les données sont consultées, ce n'est qu'alors qu'elles sont classées, organisées ou analysées.

Hadoop, un framework open-source pour le traitement et l'analyse de Big Data, peut être utilisé pour passer au crible les données du référentiel.