Système de fichiers google (gfs)

Définition - Que signifie Google File System (GFS)?

Google File System (GFS) est un système de fichiers distribué (DFS) évolutif créé par Google Inc. et développé pour répondre aux exigences croissantes de Google en matière de traitement des données. GFS offre la tolérance aux pannes, la fiabilité, l'évolutivité, la disponibilité et les performances aux grands réseaux et aux nœuds connectés. GFS est composé de plusieurs systèmes de stockage construits à partir de composants matériels de base à faible coût. Il est optimisé pour répondre aux différents besoins d'utilisation et de stockage des données de Google, comme son moteur de recherche, qui génère d'énormes quantités de données qui doivent être stockées.

Le système de fichiers Google a capitalisé sur la force des serveurs prêts à l'emploi tout en minimisant les faiblesses matérielles.

GFS est également connu sous le nom de GoogleFS.

Definir Tech explique le système de fichiers Google (GFS)

Le cluster de nœuds GFS est un seul maître avec plusieurs serveurs de blocs auxquels différents systèmes clients accèdent en permanence. Les serveurs de blocs stockent les données sous forme de fichiers Linux sur des disques locaux. Les données stockées sont divisées en gros morceaux (64 Mo), qui sont répliqués sur le réseau au moins trois fois. La grande taille des blocs réduit la surcharge du réseau.

GFS est conçu pour répondre aux exigences des grands clusters de Google sans alourdir les applications. Les fichiers sont stockés dans des répertoires hiérarchiques identifiés par des noms de chemin. Les métadonnées - telles que l'espace de noms, les données de contrôle d'accès et les informations de mappage - sont contrôlées par le maître, qui interagit avec et surveille les mises à jour de l'état de chaque serveur de bloc via des messages de pulsation chronométrés.

Les fonctionnalités de GFS incluent:

  • Tolérance aux pannes
  • Réplication de données critiques
  • Récupération automatique et efficace des données
  • Débit global élevé
  • Interaction client-maître réduite en raison de la taille importante du serveur
  • Gestion et verrouillage des espaces de noms
  • La haute disponibilité

Les plus grands clusters GFS ont plus de 1,000 300 nœuds avec une capacité de stockage sur disque de XNUMX To. Cela peut être consulté par des centaines de clients sur une base continue.