Poker : Pourquoi L'Intelligence Artificielle Bat Désormais Tous Les Champions

Bien que l’Intelligence Artificielle eût déjà réussi à battre les humains à d’autres jeux tels que les échecs et le Go (des jeux suivant des règles prédéfinies et sans hasard), gagner une partie de poker s’était avéré beaucoup plus complexe, car ce jeu requiert de la stratégie, de l’intuition, et un raisonnement basé sur des informations cachées. Mais malgré ces obstacles, l’intelligence artificielle peut maintenant jouer – et gagner – au poker.

Les systèmes d’intelligence artificielle tels que DeepStack et Libratus ont ouvert la voie à Pluribus, l’IA qui a battu cinq autres joueurs lors d’un Texas Hold’em à six, la version la plus populaire du poker. Cet exploit va au-delà du jeu : il signifie que l’intelligence artificielle peut à présent s’étendre pour aider à résoudre certains des enjeux mondiaux les plus complexes.

Tuomas Sandholm, un professeur de l’Université Carnegie Mellon ayant participé à la création de Pluribus, a indiqué dans un communiqué de presse : « La capacité de battre cinq autres joueurs à un jeu si complexe offre de nouvelles opportunités d’utiliser l’IA pour résoudre un large éventail de problèmes du monde réel ».

DeepStack : une approche graduelle pour gagner au poker

L’équipe de DeepStack, de l’Université d’Alberta à Edmonton au Canada, a combiné le machine learning profond et des algorithmes pour créer une IA capable de gagner au Texas Hold’em « no limit » à deux joueurs, un jeu plus complexe à maîtriser que d’autres pour une IA, en raison de sa nature aléatoire, des cartes cachées et du bluff des joueurs. Les réseaux neuronaux de DeepStack ont été entraînés à résoudre plus de 10 millions de situations de poker. L’IA s’appuie sur ses réseaux neuronaux afin de déterminer les meilleurs coups à jouer. DeepStack a joué au Texas Hold’em à deux joueurs contre des joueurs de poker professionnels de la Fédération Internationale de Poker. Après avoir joué 44 852 parties, les résultats de DeepStack étaient dix fois supérieurs à ce qu’un joueur de poker professionnel considère comme une marge importante.

Libratus maîtrise le Texas Hold’em à deux joueurs

Libratus est une IA, élaborée en 2017 par Noam Brown et Tuomas Sandholm de l’Université Carnegie Mellon, qui a fini par être imbattable au poker à deux joueurs. Ce système requiert 100 processeurs pour fonctionner. Libratus a joué 120 000 mains lors d’une compétition de poker d’une durée de 20 jours contre quatre des meilleurs joueurs de Texas Hold’em. Elle a gagné un montant faramineux et est repartie avec 1,8 million de dollars en jetons.

Pluribus : un robot surhumain joueur de poker

Une étape très importante a été franchie par Pluribus, un robot qui a réussi à battre certains des meilleurs joueurs de poker au monde dans un jeu de Texas Hold’em à six joueurs. Les scientifiques de l’Université Carnegie Mellon et l’IA de Facebook ont collaboré sur ce projet – le premier consistant en une IA concourant dans un jeu contre plus d’une personne et dans lequel elle ne pourrait pas uniquement s’appuyer sur la stratégie pour gagner. Maintenant que l’intelligence artificielle est capable de battre plusieurs joueurs à un jeu aussi complexe, cela ouvre la voie à la résolution de certains des problèmes mondiaux les plus frustrants, tels que les négociations automatisées, le développement des médicaments, la sécurité et la cyber-sécurité, les voitures autonomes, et une meilleure détection des fraudes.

Les résultats de Pluribus sont impressionnants. Cette IA a joué 10 000 mains de poker contre cinq autres joueurs provenant d’un groupe de gagnants d’un million de dollars au poker. En moyenne, Pluribus a gagné 480 $ de ses adversaires humains toutes les 100 mains – ce qui est comparable à ce que les joueurs de poker professionnels visent à atteindre.

L’équipe de recherche a créé Pluribus en partant de ce qu’elle avait appris de Libratus. Elle a complètement remanié l’algorithme de recherche. En règle générale, une partie de la recette du succès d’une IA lorsqu’elle joue à des jeux stratégiques contre un adversaire consiste à procéder par arbres de décisions jusqu’à la fin du jeu avant de faire quoi que ce soit. Cependant, dans un jeu à plusieurs joueurs, ce processus n’était pas faisable, car il y avait trop d’informations dissimulées et les possibilités à analyser étaient bien plus nombreuses. La solution pour Pluribus était de prévoir seulement quelques coups d’avance afin de déterminer son action, plutôt que d’évaluer tous les coups possibles jusqu’à la fin du jeu. L’IA se forme grâce à l’apprentissage par renforcement, analysant continuellement les mouvements précédents et évaluant les chances de succès en fonction des circonstances. Si elle détermine que le résultat aurait été meilleur avec un mouvement différent, elle apprend à appliquer cette stratégie dans un jeu futur.

Avant de se mesurer à des humains, Pluribus a joué des billions de mains de poker contre elle-même. Elle a ensuite affronté un seul joueur de poker professionnel. Lorsque l’IA faisait une erreur, le joueur en informait l’équipe. Très vite, le robot s’est amélioré de plus en plus rapidement au fur et à mesure des nouvelles informations, passant rapidement d’un niveau médiocre à celui d’un des meilleurs joueurs de poker au monde. Enfin, elle a déterminé son propre style de jeu, adoptant même des stratégies mixtes en fonction de la situation, afin de battre cinq autres joueurs.

Poker : Pourquoi L’Intelligence Artificielle Bat Désormais Tous Les Champions

Forbes

Newsletter quotidienne Forbes

Pourquoi le RAG est l’élément clé d’une IA générative fiable en entreprise

L’Arabie saoudite investit des milliards de dollars dans l’IA, mais certains fondateurs attendent toujours de recevoir les fonds promis

L’éditeur de GTA licencie des centaines d’employés pour faire des économies

Pourquoi le RAG est l’élément clé d’une IA générative fiable en entreprise

L’Arabie saoudite investit des milliards de dollars dans l’IA, mais certains fondateurs attendent toujours de recevoir les fonds promis

L’éditeur de GTA licencie des centaines d’employés pour faire des économies