Définition - Que signifie la sélection des fonctionnalités?
Dans l'apprentissage automatique, la sélection de fonctionnalités consiste à utiliser des variables ou des points de données spécifiques pour maximiser l'efficacité dans ce type de science des données avancée.
La sélection d'entités est également appelée sélection de variables, sélection d'attributs ou sélection de sous-ensembles.
Definir Tech explique la sélection des fonctionnalités
Grâce à la sélection des fonctionnalités, les ingénieurs et les scientifiques des données sont en mesure d'éliminer une grande partie du «bruit» dans un système donné. L'utilisation de la sélection de fonctionnalités permet d'éliminer les données redondantes ou non pertinentes, et cette élimination peut renforcer les résultats de l'apprentissage automatique. Par exemple, dans un projet de biologie marine, les chercheurs pourraient utiliser la sélection de caractéristiques pour sélectionner uniquement certaines informations de classification sur une ou plusieurs espèces étudiées, et éliminer d'autres données qui ne sont pas au cœur du projet.
La sélection des fonctionnalités peut être effectuée avec divers types d'outils, notamment Weka, Scikit-learn et R. Cela peut aider à créer des modèles plus précis et à améliorer généralement les processus d'apprentissage automatique. Les ingénieurs doivent travailler avec la sélection des fonctionnalités et les données d'entraînement pour éviter le surajustement et d'autres problèmes. La sélection des fonctionnalités aide également les équipes à éviter la «malédiction de la dimensionnalité», qui est un raccourci pour certains types de problèmes de données dans des opérations informatiques complexes.