Site scraper

Un site scraper est un type de logiciel utilisé pour copier le contenu d'un site Web. Les scraper de sites fonctionnent de manière similaire aux crawlers web, qui remplissent essentiellement la même fonction dans le but d'indexer les sites web. Les crawlers Web peuvent couvrir l'ensemble du Web, mais pas les scrapeurs de sites, qui sont capables de cibler des sites Web spécifiques. En fonction du programme de grattage et des spécifications de l'utilisateur, le logiciel peut télécharger n'importe quelle donnée, y compris des sites Web entiers, et suivre des liens vers d'autres contenus pour d'autres téléchargements. Les données obtenues peuvent être enregistrées sous forme de fichiers texte, CSV, HTML ou XML ; certains outils de grattage permettent également l'exportation vers une base de données compatible. Le raclage de contenu a de nombreux objectifs légitimes, mais il est aussi souvent utilisé pour le vol de données et le plagiat. Les sites Web de grattage sont des sites qui présentent le contenu d'autres sites Web.

Web Content Extractor est un type de scraper de site. Il comprend Wget, ScrapeGoat, Scraper et une extension Chrome.

Vous pouvez également être intéressé
  1. Site de reprise après sinistre (site dr) Définition - Que signifie le site de reprise après sinistre (site DR)? Un site de reprise après sinistre (site DR) est une installation de sauvegarde alternative, généralement de nature informatique, qui est utilisée lorsqu'un emplacement principal devient inutilisable en raison d'une panne ou d'un sinistre. Il contient des équipements et...
  2. VPN de site à site Définition - Que signifie VPN de site à site? Le VPN de site à site est un type de connexion VPN qui est créé entre deux emplacements distincts. Il permet de connecter des sites ou des réseaux géographiquement séparés, généralement via la connexion Internet publique ou une connexion WAN. Definir...

Asheesh Larroia décrit le web scraping dans cette vidéo.

  1. Planification des ressources d’entreprise sur site (ERP sur site) Définition - Que signifie la planification des ressources d'entreprise sur site (ERP sur site)? La planification des ressources d'entreprise sur site (ERP sur site) fait référence à la décision d'une entreprise de se procurer un logiciel ERP en interne et de le maintenir dans un bureau physique, plutôt que de...
  2. Protection des données hors site Définition - Que signifie la protection des données hors site? La protection des données hors site est le processus de stockage et de protection des données de sauvegarde sur un périphérique ou une installation de stockage de sauvegarde externe / hors site. Il est similaire aux techniques de sauvegarde de...