AlphaGo, le programme informatique doué d’intuition

par | 11 Juin 2023

AlphaGo

Pour la première fois l’année dernière une machine gagnait contre un homme au jeu du go, un jeu de stratégie très intuitif. Ce caractère intuitif du jeu rend cette victoire d’autant plus impressionnante, l’intuition étant un paramètre impossible à configurer chez une machine.

Pourtant, après une décennie de recherches, Demis Hassabis, PDG de Google DeepMind, réussit à créer un semblant d’intuition chez une machine, et voit en octobre 2015 sa création AlphaGo battre sans handicap le champion européen de go Fan Hui. En mars 2016, ce sera au tour du meilleur joueur de go au monde Lee Sedol d’affronter le joueur sans pouls. Un match très attendu qui pourrait bouleverser le domaine de l’intelligence artificielle.

Tout d’abord, une description d’AlphaGo s’impose

AlphaGo naît de la passion et de l’admiration qu’éprouve Demis Hassabis pour le jeu de go. « J’ai commencé à jouer aux échecs très jeune, le premier jeu pour lequel je suis tombé amoureux. Mais quand je suis allé à Cambridge pour mes études, il y avait un club de go très influent avec des joueurs actifs et beaucoup de mathématiciens. Le jeu semblait attiré les mathématiciens. Depuis, je suis tombé amoureux du jeu, et me suis toujours dit que ça serait un vrai défi pour un ordinateur d’être en mesure de jouer un jeu aussi esthétique et intuitif que le jeu de go. Un plus grand défi encore que de jouer aux échecs », a-t-il confié au magazine Nature.

Pour relever ce défi, Demis Hassabis a doté AlphaGo de deux réseaux de neurones, deux systèmes d’apprentissage et « l’entraîne » intensivement

Ces deux réseaux de neurones sont les réseaux « value » et « policy ». Le premier détermine la probabilité de victoire de chaque coup sur l’ensemble du plateau, le second trie les données qui en découlent et sélectionne les coups les plus prometteurs. Cependant, aussi infaillible que soient ces réseaux de neurones, AlphaGo n’est pas en mesure de prédire ce que son adversaire fera. En effet, à la différence des échecs, le plateau du go est bien plus large, le nombre de coups possibles est par conséquent lui aussi plus important. En effet, selon Demis Hassabis, le nombre de configurations possibles à chaque tour sur l’ensemble du plateau est supérieur au nombre d’atomes dans l’univers. La machine peut ainsi faire des erreurs. Toutefois, pour éviter qu’elles ne se reproduisent, deux systèmes d’auto-apprentissage ont été mis en place : le deep-learning et l’apprentissage renforcé. Ces deux systèmes d’apprentissage sont régulièrement mis à l’épreuve et améliorés via la confrontation d’AlphaGo à des experts et d’autres programmes informatiques. Jusqu’à présent, sur 500 matchs contre d’autres programmes informatiques, AlphaGo n’en a perdu qu’un.

Nature rapporte que pour le vaincu Fan Hui, AlphaGo paraît très humain

« Je sais qu’AlphaGo est un ordinateur, mais si personne ne me l’avait dit, j’aurais sûrement pensé que le joueur était un peu bizarre, mais très fort, une vraie personne ». « Un peu bizarre », c’est sûrement ce trait qui fera défaut à la machine lors du match de mars. En effet, son semblant d’intuition n’est vraisemblablement pas tout à fait au point, une faille qui pourrait coûter cher à Google DeepMind. En effet, le niveau de Lee Sedol n’a pas d’égal. Il est dans le circuit des tournois professionnels de go depuis l’âge de 13 ans, et connaît la consécration dès l’âge de 17 ans. Il domine ensuite la tête du classement mondial pendant près d’une décennie.

Lorsqu’il est interrogé sur son match contre AlphaGo, le prodige du go dit être confiant sur l’issue du match : « Je reste confiant en une victoire, du moins pour cette fois-ci ». « Du moins pour cette fois-ci », par ces paroles, Lee Sedol est bien conscient qu’AlphaGo se renforce chaque jour, et qu’il ne pourra pas le battre indéfiniment. Il fait également référence aux fameuses confrontations entre DeepBlue, invention d’IBM, et Gary Kasparov. Leur premier match s’était soldé par la victoire du Russe, mais le second par sa défaite, même si un bug informatique serait à l’origine de la victoire de DeepBlue.

Bug informatique ou pas, Google croit en une victoire de l’intelligence artificielle sur l’homme et ne s’en cache pas

Contrairement aux humains, AlphaGo peut jouer une infinité de matchs sans se fatiguer, et par conséquent, s’améliorer beaucoup plus rapidement et atteindre un niveau qu’un humain ne pourra jamais atteindre. Google voit en AlphaGo un programme informatique qui sera utilisé par les joueurs professionnels du go pour s’entraîner et améliorer les points sur lesquels ils font des erreurs ou leurs faiblesses. Un futur bien optimiste qu’envisagent Demis Hassabis et son équipe pour AlphaGo qui pourrait ne pas se produire d’ici tôt. Pour l’instant, Lee Sedol est le grand favori du match et devrait l’emporter.

TAGs :

Rédigé par Jade Bernard

La rédaction, c'est la vie ! J'adore les mots, je partage mon avis avec passion !

Vous pourriez aimer ces contenus

0 commentaires

Soumettre un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Pin It on Pinterest

Share This