Extraction d’informations (IE)

L'extraction d'informations (IE) est la récupération automatisée d'informations spécifiques liées à un sujet sélectionné à partir d'un ou plusieurs corps de texte. Les outils d'extraction d'informations vous permettent d'extraire des informations de sites Web, de documents textuels et de bases de données. L'IE peut extraire des informations de textes structurés, semi-structurés et lisibles par machine. L'IE peut être utilisée pour extraire un texte structuré d'un texte non structuré.

La reconnaissance des entités nommées (NER) est un sous-outil qui permet d'extraire des informations. Il est utilisé pour localiser des informations ciblées et les extraire. NER reconnaît d'abord une entité comme l'une des nombreuses catégories, telles que les personnes (PER), le lieu (LOC) ou l'organisation (ORG). Une fois la catégorie d'information reconnue, un utilitaire d'extraction d'information extrait les informations connexes de l'entité nommée et en construit un document lisible par machine, que des algorithmes peuvent ensuite traiter pour en extraire le sens. L'IE peut également trouver du sens par le biais de sous-tâches telles que la résolution de coréférences et l'extraction de relations. Parfois, l'IE extrait même du son.

Vous pouvez également être intéressé
  1. Extraction de règles d’association Définition - Que signifie le minage de règles d'association? L'exploration de règles d'association est une procédure destinée à rechercher des modèles fréquents, des corrélations, des associations ou des structures causales à partir d'ensembles de données trouvés dans divers types de bases de données telles que des bases de données relationnelles,...
  2. Extraction de données Définition - Que signifie l'extraction de données? L'extraction de données est l'endroit où les données sont analysées et explorées pour récupérer des informations pertinentes à partir de sources de données (comme une base de données) dans un modèle spécifique. Un traitement supplémentaire des données est effectué, ce qui implique l'ajout...

L'IE a été créé au début des années 1970 par le traitement du langage naturel. JASPER, un système qui permet l'utilisation de l'IE par l'université Reuters à l'université Carnegie Melon, en est un exemple. Les efforts actuels de traitement des documents multimédias comprennent l'annotation automatique, la reconnaissance du contenu et l'extraction à partir d'images et de vidéos. Une IE de haute qualité peut être difficile pour les systèmes d'IA en raison de la complexité du langage.

  1. Langage d’extraction de processus métier pour les services Web (bpelws) Définition - Que signifie le langage BPELWS (Business Process Extraction Language for Web Services)? Le langage d'extraction de processus métier pour les services Web (BPELWS) spécifie les processus métier et les protocoles d'interaction. Il s'agit d'un langage basé sur XML facilitant le partage des tâches dans l'informatique distribuée entre plusieurs...
  2. Ripping (extraction numérique) L'extraction numérique est également connue sous le nom de ripping. Elle consiste à copier des fichiers audio et vidéo d'un disque optique, d'un DVD ou d'un média en continu sur un disque dur. Un programme de ripper possède un encodeur pour compresser le média source et réduire la taille du...