Exploration de Web

Définition - Que signifie Web Mining?

L'exploration Web consiste à utiliser des techniques et des algorithmes d'exploration de données pour extraire des informations directement du Web en les extrayant à partir de documents et de services Web, de contenu Web, d'hyperliens et de journaux de serveur. Le but de l'exploration Web est de rechercher des modèles dans les données Web en collectant et en analysant des informations afin de mieux comprendre les tendances, l'industrie et les utilisateurs en général.

Definir Tech explique le Web Mining

L'exploration Web est une branche de l'exploration de données se concentrant sur le World Wide Web en tant que source de données principale, y compris tous ses composants, du contenu Web, des journaux de serveur à tout ce qui se trouve entre les deux. Le contenu des données extraites du Web peut être un ensemble de faits que les pages Web sont censées contenir, et ceux-ci peuvent être constitués de texte, de données structurées telles que des listes et des tableaux, et même des images, de la vidéo et de l'audio.

Catégories de Web mining:

  • Exploration de contenu Web - Il s'agit du processus d'extraction d'informations utiles à partir du contenu des pages Web et des documents Web, qui sont principalement du texte, des images et des fichiers audio / vidéo. Les techniques utilisées dans cette discipline ont été largement tirées du traitement du langage naturel (PNL) et de la recherche d'informations.
  • Exploration de la structure Web - Il s'agit du processus d'analyse des nœuds et de la structure de connexion d'un site Web grâce à l'utilisation de la théorie des graphes. Il y a deux choses qui peuvent être obtenues à partir de cela: la structure d'un site Web en ce qui concerne la façon dont il est connecté à d'autres sites et la structure du document du site Web lui-même, quant à la façon dont chaque page est connectée.
  • Exploration de l'utilisation du Web - Il s'agit du processus d'extraction de modèles et d'informations à partir des journaux du serveur pour obtenir un aperçu de l'activité des utilisateurs, y compris d'où viennent les utilisateurs, combien ont cliqué sur quel élément du site et les types d'activités effectuées sur le site.