Problème d’apprentissage de la valeur

Définition - Que signifie le problème d'apprentissage de la valeur?

Le problème de l'apprentissage de la valeur est une question fondamentale spécifique dans le développement des technologies d'apprentissage automatique et d'intelligence artificielle qui aborde la différence entre les humains et les ordinateurs, ainsi que leurs façons de penser.

En un mot, le problème de l'apprentissage de la valeur est basé sur la difficulté pour les ordinateurs de déterminer ce qu'il faut «valoriser» (en termes de données et de politique) et comment agir dans un réseau d'apprentissage automatique, et comment les programmeurs peuvent optimiser le programme agit pour correspondre à leurs intentions d'origine lors de sa création.

Definir Tech explique le problème d'apprentissage de la valeur

La clé du problème d'apprentissage de la valeur est qu'il est extrêmement important pour les programmeurs de pouvoir créer des programmes d'apprentissage automatique qui mettent en œuvre les valeurs voulues. Cependant, le hic, c'est que les valeurs ne peuvent pas être explicitement énoncées de manière à entraver l'apprentissage du programme lui-même.

Les gens parlent parfois de la `` convergence '' des technologies d'apprentissage automatique comme du succès de la concentration sur les données de valeur, mais le problème de l'apprentissage de la valeur est à certains égards un peu différent. C'est l'idée qu'il doit y avoir un moyen essentiel de montrer au programme d'apprentissage automatique ce qui est souhaité, plutôt que de simplement le préciser, ce qui est une manière déterministe d'exécuter le ML.

Par exemple, prenez cet article sur le problème de l'apprentissage de la valeur qui suggère que les programmes d'apprentissage automatique pourraient avoir un ensemble de stockage d'entrées montrant des réponses humaines positives aux stimuli. En lisant ces types d'adresses sur le problème de l'apprentissage de la valeur, il devient clair qu'il existe une lacune majeure dans l'apprentissage automatique qui n'est pas facile à corriger - essentiellement - comment les gens créent-ils des machines qui peuvent vraiment penser comme les gens? Une autre façon d'expliquer cela est que le problème de l'apprentissage de la valeur est au cœur de la façon dont nous pensons en tant qu'humains, et comment nos pensées ne sont pas toujours basées sur une entrée par cœur.

Pour que les ordinateurs modélisent notre intuition, notre instinct, nos inclinations sociales et nos valeurs éthiques les plus profondes est un défi de taille, même lorsque les ordinateurs peuvent apprendre à jouer aux échecs de manière humaine ou nous dépasser dans la résolution de problèmes mathématiques difficiles. Les professionnels peuvent s'attendre à ce que le programme d'apprentissage de la valeur continue d'être central dans le développement des technologies d'apprentissage automatique.