Données d’entraînement

Définition - Que signifient les données de formation?

L'idée d'utiliser les données de formation dans les programmes d'apprentissage automatique est un concept simple, mais il est également très fondamental dans le fonctionnement de ces technologies. Les données d'entraînement sont un ensemble initial de données utilisées pour aider un programme à comprendre comment appliquer des technologies telles que les réseaux de neurones pour apprendre et produire des résultats sophistiqués. Il peut être complété par des ensembles de données ultérieurs appelés ensembles de validation et de test.

Les données d'entraînement sont également appelées ensemble d'entraînement, ensemble de données d'entraînement ou ensemble d'apprentissage.

Definir Tech explique les données d'entraînement

L'ensemble de formation est le matériel par lequel l'ordinateur apprend à traiter les informations. L'apprentissage automatique utilise des algorithmes - il imite les capacités du cerveau humain à absorber diverses entrées et à les peser, afin de produire des activations dans le cerveau, dans les neurones individuels. Les neurones artificiels reproduisent une grande partie de ce processus avec des logiciels - des programmes d'apprentissage automatique et de réseaux de neurones qui fournissent des modèles très détaillés du fonctionnement de nos processus de pensée humaine.

Dans cet esprit, les données d'entraînement peuvent être structurées de différentes manières. Pour les arbres de décision séquentiels et ces types d'algorithmes, il s'agirait d'un ensemble de texte brut ou de données alphanumériques qui seraient classées ou autrement manipulées. En revanche, pour les réseaux de neurones convolutifs liés au traitement d'images et à la vision par ordinateur, l'ensemble d'apprentissage est souvent composé d'un grand nombre d'images. L'idée est que, parce que le programme d'apprentissage automatique est si complexe et si sophistiqué, il utilise une formation itérative sur chacune de ces images pour finalement être capable de reconnaître des caractéristiques, des formes et même des sujets tels que des personnes ou des animaux. Les données de formation sont absolument essentielles au processus - elles peuvent être considérées comme la «nourriture» que le système utilise pour fonctionner.