Les innovateurs en apprentissage par renforcement honorés par le prix Turing.

Former les machines de la manière dont les dresseurs d'animaux façonnent le comportement des chiens ou des chevaux a été une approche cruciale dans l'avancement de l'intelligence artificielle. Cette méthode a été honorée mercredi par le prestigieux prix A. M. Turing, souvent considéré comme le prix Nobel du domaine technologique. Les lauréats de cette année, Andrew Barto et Richard Sutton, sont reconnus comme des pionniers de l'apprentissage par renforcement, un domaine qui a connu d'importants développements depuis le début de leurs recherches à la fin des années 1970. Leur travail fondateur a permis de nombreuses avancées en IA au cours de la dernière décennie, mettant l'accent sur la création de machines « hédonistes » capables d'adapter leur comportement en réponse à des retours positifs. L'apprentissage par renforcement a joué un rôle déterminant lorsque le programme informatique de Google a battu les meilleurs compétiteurs humains lors du jeu de société chinois ancien, Go, en 2016 et 2017. Il joue également un rôle vital dans l'amélioration des applications IA largement utilisées comme ChatGPT, l'optimisation du trading financier et la capacité d'une main robotique à résoudre un cube Rubik. Cependant, Barto a noté que lorsque lui et Sutton, son étudiant en doctorat, ont commencé à développer leurs théories et algorithmes à l'Université du Massachusetts, à Amherst, le domaine était largement « démodé ». « Nous étions quelque peu dans le désert », a déclaré Barto lors d'une interview avec l'Associated Press. « Cela rend la réception de ce prix particulièrement gratifiante, car cela souligne la pertinence et l'intrigue de notre travail, qui n'était pas reconnu à ses débuts. » Le prix annuel d'un million de dollars, annoncé par l'Association for Computing Machinery, est parrainé par Google. Bien que Barto, désormais retraité de l'Université du Massachusetts, et Sutton, professeur de longue date à l'Université de l'Alberta au Canada, ne soient pas les premiers innovateurs en IA à recevoir le prix portant le nom du mathématicien britannique, déchiffreur de codes et pionnier précoce de l'IA Alan Turing, leurs recherches ont directement répondu à l'appel lancé par Turing en 1947 pour une machine capable de « apprendre de l'expérience ». Sutton décrit cela comme « sans doute le concept fondamental de l'apprentissage par renforcement ». Leur travail intégrait des idées de la psychologie et des neurosciences sur la façon dont les neurones motivés par le plaisir réagissent aux récompenses et aux punitions.
Un article révolutionnaire publié au début des années 1980 a mis en lumière leur nouvelle approche à travers une tâche spécifique : équilibrer un poteau sur un caddie en mouvement afin d'éviter qu'il ne tombe. Ils ont ensuite co-écrit un manuel sur l'apprentissage par renforcement qui est largement utilisé. « Les outils qu'ils ont développés sont fondamentaux pour le boom actuel de l'IA, entraînant des avancées significatives, attirant d'innombrables jeunes chercheurs et générant des milliards d'investissements », a déclaré Jeff Dean, scientifique en chef de Google, dans un communiqué écrit. Dans une interview conjointe avec l'AP, Barto et Sutton avaient parfois des points de vue différents sur l'évaluation des risques des agents IA cherchant à s'améliorer. Ils ont distingué clairement leur travail du domaine à la mode de l'IA générative, tel que les modèles de langage étendus utilisés dans les chatbots créés par OpenAI, Google et d'autres, qui reproduisent l'écriture et les médias semblables à ceux des humains. « La décision majeure est de savoir si l'on apprend à partir de données humaines ou si l'on laisse un agent IA apprendre de ses propres expériences », a expliqué Sutton. Alors que Sutton minimise ce qu'il perçoit comme des peurs exagérées concernant les menaces potentielles de l'IA pour l'humanité, Barto appelle à la prudence, affirmant : « Nous devons rester conscients des conséquences imprévues potentielles. » Barto, qui est à la retraite depuis 14 ans, se considère comme un Luddite, en contraste avec Sutton, qui prévoit un avenir où des entités possédant une intelligence supérieure à celle des humains existent - un concept connu sous le nom de posthumanisme. « Les humains sont des machines, des machines remarquables et extraordinaires, mais elles ne sont pas le produit final et pourraient fonctionner mieux », a observé Sutton. « C'est intrinsèquement une part de l'effort en IA », a conclu Sutton. « Nous visons à mieux nous comprendre et à développer des systèmes qui peuvent fonctionner encore plus efficacement. Peut-être même à devenir de telles entités. »
Brief news summary
Andrew Barto et Richard Sutton, reconnus comme des pionniers dans le domaine de l'apprentissage par renforcement, ont reçu le prix A.M. Turing pour leurs contributions significatives à l'intelligence artificielle (IA) depuis la fin des années 1970. Ils ont été à l'avant-garde des systèmes d'IA similaires à l'entraînement animal par des mécanismes de récompense, facilitant d'importants progrès dans le domaine. Leurs innovations ont conduit à des jalons notables tels que le triomphe de Google au jeu de Go, des améliorations dans ChatGPT et des avancées en robotique. À l'origine accueillis avec scepticisme, Barto et Sutton ont réussi à fusionner des idées provenant des neurosciences et de la psychologie en étudiant les systèmes de récompense du cerveau. Leur collaboration a abouti à des travaux influents qui ont ravivé l'intérêt et l'investissement dans l'IA. Bien qu'ils partagent un héritage commun, Barto et Sutton ont des opinions divergentes concernant les risques et les implications sociétales de l'IA. Barto plaide pour une approche prudente, tandis que Sutton reste optimiste quant aux perspectives des systèmes intelligents. Ces points de vue différents contribuent à un dialogue plus riche sur la capacité de l'IA à améliorer la compréhension humaine et à stimuler davantage l'innovation dans le secteur.
AI-powered Lead Generation in Social Media
and Search Engines
Let AI take control and automatically generate leads for you!

I'm your Content Manager, ready to handle your first test assignment
Learn how AI can help your business.
Let’s talk!
Hot news

Montée des compagnons d'IA chez les Virginiens cé…
De nouvelles données de Match révèlent que 18 % des Virginiens célibataires ont intégré l'intelligence artificielle (IA) dans leur vie sentimentale, une augmentation significative par rapport à 6 % l’année précédente.

Les investisseurs en capital risque de type Ponzi…
Selon Romeo Kuok, un membre du conseil d'administration de BGX Ventures, la majorité des transactions sont conçues pour permettre des sorties rapides plutôt que de générer des revenus d'entreprise à long terme.

Les juges IA de Wimbledon reçoivent des avis cont…
Le All England Club a marqué une étape importante lors de Wimbledon 2025 en remplaçant les juges de ligne traditionnels par le système électronique d’appel de ligne Hawk-Eye alimenté par l’IA (ELC).

JPMorgan teste la tokenisation des crédits carbon…
JPMorgan Chase & Co.

La BCE approuve deux projets de blockchain pour m…
La Banque centrale européenne entame une transformation technologique majeure.

La stratégie puissante de Nvidia
Nvidia, une entreprise technologique de premier plan, reconnue pour ses processeurs graphiques et son intelligence artificielle, a annoncé un partenariat stratégique pour lancer Emerald AI, une startup innovante axée sur la gestion durable de l’énergie dans les centres de données.

Le Sénat supprime la disposition sur l'IA du proj…
Le 1er juillet 2025, le Sénat américain a adopté à une écrasante majorité, 99 voix contre 1, la suppression d’une disposition controversée du paquet législatif du président Donald Trump.