巴托和萨顿因强化学习创新获得图灵奖
Brief news summary
1977年,安德鲁·巴尔托开始探讨神经元如何像享乐主义者一样运作,旨在最大化快乐和最小化痛苦。次年,理查德·萨顿加入了他的研究,两人共同制定了“强化学习”理论,这一框架解释了人工智能(A.I.)系统如何通过类似于快乐和痛苦的经验进行学习。这一开创性的理论已经成为A.I.发展的关键,促成了谷歌的AlphaGo和OpenAI的ChatGPT等重大突破。最近,巴尔托和萨顿因在该领域的开创性努力获得了图灵奖,图灵奖常被称为计算机领域的诺贝尔奖,他们分享了100万美元的奖金。他们在1998年出版的有影响力的书籍《强化学习:导论》,继续为学习这一不断发展的A.I.领域的人们提供重要资源。著名计算机科学教授奥伦·埃茨宗赞扬了他们的工作,强调其对A.I.学科及未来潜力的基础性影响。在1977年,马萨诸塞大学阿默斯特分校的研究员安德鲁·巴托(Andrew Barto)开始研究一种新理论,认为神经元的行为类似于享乐主义者。其基本前提是,人脑通过数十亿个神经细胞运作,每个细胞都力求最大化快乐和最小化痛苦。 次年,另一位年轻研究员理查德·萨顿(Richard Sutton)加入了他。两人希望通过这一简单概念阐明人类智慧,并将其应用于人工智能。这一合作促成了“强化学习”的发展,这是一种允许人工智能系统从其数字化的快乐与痛苦的体验中学习的方法。 本周三,全球最大的计算机专家专业协会——计算机协会宣布,巴托博士和萨顿博士因对强化学习的贡献获得今年的图灵奖。图灵奖成立于1966年,被广泛认为是计算机领域的诺贝尔奖。两位研究人员将共享与这一荣誉相关的100万美元奖金。 在过去十年中,强化学习在推动人工智能发展方面至关重要,驱动了如谷歌的AlphaGo和OpenAI的ChatGPT等具有里程碑意义的技术。这些创新背后的基础技术源于巴托博士和萨顿博士的研究。 “他们是强化学习无可争议的先锋,”华盛顿大学计算机科学名誉教授、艾伦人工智能研究所创始首席执行官奥伦·埃齐奥尼(Oren Etzioni)评论道,“他们提出了基本思想,并撰写了该领域的权威著作。” 他们的著作《强化学习:导论》于1998年出版,至今仍然被视为这一许多专家认为仍处于完全潜力初期阶段的思想的权威资源。
Watch video about
巴托和萨顿因强化学习创新获得图灵奖
Try our premium solution and start getting clients — at no cost to you