Grattage de contenu

Définition - Que signifie le scraping de contenu?

Le scraping de contenu est un moyen illégal de voler le contenu original d'un site Web légitime et de publier le contenu volé sur un autre site à l'insu ou sans l'autorisation du propriétaire du contenu. Les scrapers de contenu tentent souvent de faire passer le contenu volé comme le sien et ne parviennent pas à attribuer l'attribution aux propriétaires du contenu.

Le scraping de contenu peut être effectué via un copier-coller manuel, ou peut utiliser des techniques plus sophistiquées, telles que l'utilisation d'un logiciel spécial, de la programmation HTTP ou d'analyseurs HTML ou DOM.

Une grande partie du contenu qui est en proie au grattage est du matériel protégé par le droit d'auteur; le republier sans l'autorisation du titulaire du droit d'auteur est une infraction punissable. Cependant, les sites de scrapers sont hébergés partout dans le monde, et les scrapers qui sont invités à supprimer du contenu protégé par des droits d'auteur peuvent simplement changer de domaine ou disparaître.

Definir Tech explique le raclage de contenu

Les scrapers de contenu sont capables de générer du trafic vers leurs sites Web en récupérant du contenu de haute qualité et riche en mots clés à partir d'autres sites. Les blogueurs sont particulièrement sensibles à cela, probablement parce qu'il est peu probable que les blogueurs individuels lancent une attaque légale contre les scrapers. Les gratteurs sont encouragés à poursuivre cette pratique car les moteurs de recherche n'ont pas encore trouvé de moyen efficace de filtrer le contenu unique du contenu gratté, ce qui permet aux gratteurs de continuer à en bénéficier.

Les administrateurs de sites Web peuvent se protéger contre le grattage grâce à des mesures simples, telles que l'ajout de liens vers leur propre site dans le contenu. Cela leur permettra au moins d'obtenir du trafic à partir du contenu récupéré. Les méthodes plus sophistiquées de gestion du grattage par les robots comprennent:

  • Applications commerciales anti-bot
  • Attraper des robots avec un pot de miel et bloquer leurs adresses IP
  • Bloquer les bots avec du code JavaScript