Sql sur hadoop

Définition - Que signifie SQL sur Hadoop?

SQL on Hadoop est un type d'outil d'application analytique - l'implémentation SQL sur la plate-forme Hadoop, qui combine l'interrogation standard de type SQL de données structurées avec le framework de données Hadoop. Hadoop est une plate-forme relativement nouvelle, tout comme le Big Data lui-même, et peu de professionnels en sont experts, mais SQL sur Hadoop simplifie l'accès au framework Hadoop et facilite sa mise en œuvre sur les systèmes d'entreprise actuels.

Definir Tech explique SQL sur Hadoop

SQL sur Hadoop fait référence à diverses implémentations de SQL pour la plate-forme Hadoop. MapReduce, qui est le mappeur de travaux de cluster et l'organisateur de résultats de Hadoop, prend en charge SQL en tant que cas d'utilisation majeur ainsi que d'autres méthodes de traitement. Par conséquent, il est logique de créer des outils puissants pour autoriser SQL, qui est l'un des langages les plus largement utilisés pour les requêtes et la manipulation de bases de données. Alors que Hadoop gagne en popularité pour l'architecture de données d'entreprise, SQL est essentiel pour une adoption appropriée à la fois pour les données faiblement structurées et les données structurées utilisées dans Hadoop.

Les pilotes clés SQL sur Hadoop incluent:

  • Tirer parti des compétences SQL existantes présentes dans la plupart des organisations
  • Réutilisation de la charge de transformation d'extrait (ETL), de la veille stratégique (BI) et des investissements dans l'infrastructure d'analyse dans Hadoop

Certaines implémentations SQL sur Hadoop incluent:

  • Apache Spark SQL
  • Apache Hive
  • Apache Tage
  • Forage Apache
  • HP Vertica sur MapR
  • Pilotes ODBC
  • Presto
  • requin