Alphago

Définition - Que signifie AlphaGo?

AlphaGo est une IA étroite, un programme informatique développé par Google DeepMind pour jouer à Go, un jeu de plateau de stratégie chinois pour deux joueurs similaire aux échecs. AlphaGo est le tout premier programme d'IA qui a pu battre un joueur humain professionnel, le joueur 2-dan Fan Hui en octobre 2015, sur un plateau pleine grandeur sans handicap. Il a ensuite battu l'un des joueurs humains les mieux classés au monde, le 9 dan Lee Sedol, en mars 2016, remportant quatre matchs sur cinq.

Definir Tech explique AlphaGo

Le projet AlphaGo a été lancé en 2014 en tant que banc d'essai afin de voir à quel point l'algorithme de réseau neuronal de Google DeepMind utilisant l'apprentissage en profondeur pouvait être compétitif chez Go. L'algorithme d'AlphaGo est une combinaison de techniques de recherche arborescente et d'apprentissage automatique et renforcé par une formation approfondie avec des humains et d'autres joueurs informatiques. Il utilise la recherche arborescente de Monte Carlo et est guidé par un réseau de politiques et de valeurs, mis en œuvre à l'aide de technologies de réseau neuronal profond. Le réseau de politiques est formé et aide l'IA à prédire le prochain mouvement le plus susceptible de gagner tandis que le réseau de valeur est formé pour affiner l'arbre de recherche et déterminer la valeur de ces positions, en estimant les gagnants dans chaque position plutôt que de chercher tout en bas. jusqu'à la fin du jeu.

AlphaGo a d'abord été alimenté par des mouvements de match historiques de joueurs humains, utilisant une base de données d'environ 30 millions de coups, ce qui en fait imiter les jeux humains. Une fois que l'IA a atteint un certain niveau de compétence, elle a été formée davantage en la faisant jouer contre des instances d'elle-même, en utilisant l'apprentissage par renforcement pour s'améliorer et en apprendre davantage.

En octobre 2015, une version informatique distribuée d'AlphaGo a joué et vaincu Fan Hui, un champion d'Europe de Go 2 dan, marquant la première fois qu'un programme informatique avait battu un joueur professionnel à Go. Fan Hui a ensuite aidé en tant que consultant pour l'équipe DeepMind des mois après sa défaite. En mars 2016, AlphaGo a affronté Lee Sedol, l'un des joueurs les mieux classés au monde, ayant atteint le plus haut niveau de 9 dan. Gagner quatre jeux contre celui de Lee, cela a marqué une avancée majeure dans la recherche sur l'IA, car cela signifiait que l'algorithme d'apprentissage en profondeur et de réseaux neuronaux utilisé par DeepMind peut être utilisé à d'autres fins car il n'était pas vraiment programmé pour jouer à Go, mais plutôt enseigné. comment jouer à Go. Cela ouvre un tout nouveau monde pour la recherche sur l'IA.