Apache sqoop

Définition - Que signifie Apache Sqoop?

Apache Sqoop ("SQL to Hadoop") est une application Java en mode console conçue pour transférer des données en masse entre Apache Hadoop et des banques de données non Hadoop, telles que des bases de données relationnelles, des bases de données NoSQL et des entrepôts de données. La version 1.4.4 est sortie le 31 juillet 2013.

Definir Tech explique Apache Sqoop

Les entreprises qui utilisent Hadoop jugent nécessaire de transférer certaines de leurs données des systèmes de gestion de bases de données relationnelles (SGBDR) traditionnels vers l'écosystème Hadoop.

Sqoop, partie intégrante de Hadoop, peut effectuer ce transfert de manière automatisée. De plus, les données importées dans Hadoop peuvent être transformées avec MapReduce avant de les exporter vers le SGBDR. Sqoop peut également générer des classes Java pour interagir par programme avec les données importées.

Sqoop utilise une architecture basée sur des connecteurs qui lui permet d'utiliser des plugins pour se connecter à des bases de données externes.