March 5, 2025, 7:51 p.m.
929

Відзначено новаторів у сфері навчання з підкріпленням премією Тюрінга.

Brief news summary

Ендрю Барто та Річард Саттон, визнані піонерами навчання з підкріпленням, отримали премію імені А. М. Тюрінга за свої значні внески в штучний інтелект (ШІ) з кінця 1970-х років. Вони стали піонерами систем ШІ, схожих на навчання тварин за допомогою механізмів винагороди, що сприяло значним досягненням у цій сфері. Їхні нововведення призвели до визначних етапів, таких як тріумф Google у грі Go, покращення ChatGPT та прогрес у робототехніці. Спочатку їх підходи зустрічали скептицизм, проте Барто та Саттон ефективно об'єднали знання з нейробіології та психології, досліджуючи системи винагороди мозку. Їхня співпраця стала основою впливових робіт, які відновили інтерес і інвестиції в ШІ. Хоча вони поділяють спільну спадщину, Барто та Саттон мають різні погляди на ризики та суспільні наслідки ШІ. Барто виступає за обережну позицію, тоді як Саттон залишається оптимістичним щодо перспектив інтелектуальних систем. Ці різні точки зору сприяють більш багатому діалогу про спроможність ШІ поліпшити людське розуміння та спонукати до подальших інновацій у цій галузі.

Навчання машин, подібно до того, як тренери тварин формують поведінку собак чи коней, стало важливим підходом у розвитку штучного інтелекту. Цей метод був удостоєний престижної премії імені А. М. Тюрінга в середу, яку часто називають Нобелівською премією у світі технологій. Лауреати цьогорічної премії, Ендрю Барто та Річард Саттон, вважаються піонерами в області навчання з підкріпленням, що зазнала значних змін з моменту їхніх перших досліджень, які почалися в кінці 1970-х. Їхня основоположна робота дозволила досягти численних проривів у штучному інтелекті за останнє десятиліття, зосереджуючи увагу на створенні "гедоністичних" машин, здатних адаптувати свою поведінку у відповідь на позитивний зворотний зв'язок. Навчання з підкріпленням відіграло ключову роль у перемозі комп'ютерної програми Google над провідними людськими суперниками в древній китайській настільній грі Го в 2016 та 2017 роках. Воно також має важливе значення для покращення широко використовуваних застосувань штучного інтелекту, таких як ChatGPT, оптимізації фінансової торгівлі та дозволу роботизованій руці розв'язати кубик Рубика. Однак Барто зазначив, що коли він і Саттон, його аспірант, почали розробляти свої теорії та алгоритми в Університеті Массачусетса в Амхерсті, ця галузь здебільшого була "не в моді". "Ми певною мірою були у пустелі, " сказав Барто в інтерв'ю The Associated Press. "Це робить отримання цієї нагороди особливо приємним, оскільки підкреслює актуальність і зацікавленість нашої роботи, яка не була визнана в перші роки. " Щорічна премія в 1 мільйон доларів, про яку оголосила Асоціація обчислювальної техніки, спонсорується Google. Хоча Барто, який уже 14 років на пенсії з Університету Массачусетса, та Саттон, професор з тривалим стажем в Університеті Альберти в Канаді, не є першими інноваторами у сфері штучного інтелекту, які отримали нагороду, названу на честь британського математика, криптоаналітика та одного з перших піонерів ШІ Алана Тюрінга, їхні дослідження безпосередньо відповіли на заклик Тюрінга 1947 року про машину, здатну "навчатися з досвіду. " Саттон описує це як "можливо, основоположну концепцію навчання з підкріпленням". Їхня робота включала ідеї з психології та нейронауки про те, як нейрони, що прагнуть насолоди, реагують на винагороди та покарання.

Проривна стаття, опублікована на початку 1980-х, продемонструвала їх новий підхід через конкретне завдання: утримання стержня на рухомій платформі, щоб запобігти його падінню. Згодом вони спільно написали підручник з навчання з підкріпленням, який широко використовують. "Інструменти, які вони розробили, є основоположними для нинішнього буму штучного інтелекту, що призвело до значних досягнень, приваблюючи безліч молодих дослідників і генеруючи мільярди інвестицій, " заявив Джефф Дін, головний науковець Google, у письмовій заяві. У спільному інтерв'ю з AP Барто і Саттон іноді мали різні думки щодо оцінки ризиків агентів ШІ, які прагнуть до самовдосконалення. Вони чітко розмежували свою роботу і модний напрямок генеративного ШІ, такий як великі мовні моделі, що використовуються в чат-ботах, створених OpenAI, Google та ін. , які імітують людське письмо та медіа. "Головне питання - навчатися на людських даних чи дозволити агенту ШІ навчатися зі свого власного досвіду, " пояснив Саттон. Хоча Саттон зменшує те, що він вважає перебільшеними страхами щодо потенційних загроз від ШІ для людства, Барто закликає до обережності, зазначаючи: "Ми повинні залишатися усвідомленими можливих непередбачуваних наслідків. " Барто, який перебуває на пенсії вже 14 років, вважає себе луддитом, на відміну від Саттона, який очікує майбутнє, де існуватимуть сутності з більшою інтелектуальністю, ніж у людей — концепція, відома як постгуманізм. "Люди є машинами, вражаючими та надзвичайними машинами, але вони не є остаточним продуктом і можуть працювати краще, " зауважив Саттон. "Це вкрай важлива частина завдання штучного інтелекту, " підсумував Саттон. "Ми прагнемо зрозуміти себе і розробити системи, які можуть працювати ще ефективніше. Можливо, навіть стати такими сутностями. "


Watch video about

Відзначено новаторів у сфері навчання з підкріпленням премією Тюрінга.

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Dec. 15, 2025, 1:26 p.m.

Інтелектуальний штучний інтелект приводить до рек…

Аналіз платформи Salesforce щодо торгівельного періоду Cyber Week 2025 показує рекордний світовий розмір роздрібних продажів, що склав 336,6 мільярдів доларів, що на 7% більше ніж у попередньому році.

Dec. 15, 2025, 1:24 p.m.

Ризики вимирання штучного інтелекту: Маск та Амод…

Швидкий розвиток штучного інтелекту (ШІ) викликає значні дебати та занепокоєння серед експертів, особливо щодо його довгострокового впливу на людство.

Dec. 15, 2025, 1:21 p.m.

Зайдіть раніше за Уолл-Стріт: цей акційний сектор…

Це спонсорський контент; Barchart не підтримує сайти чи продукти, згадані нижче.

Dec. 15, 2025, 1:16 p.m.

AlphaCode від Google DeepMind: штучний інтелект з…

Нещодавно компанія Google DeepMind представила інноваційну систему штучного інтелекту під назвою AlphaCode, що є значним проривом у сфері штучного інтелекту та розробки програмного забезпечення.

Dec. 15, 2025, 1:15 p.m.

Відомий експерт з SEO пояснює, чому штучні агенти…

Я тісно слідкую за появою агентського SEO, переконаний, що з прогресом можливостей у найближчі кілька років агенти значно вплинуть на індустрію.

Dec. 15, 2025, 1:10 p.m.

Пітер Лінгтон з Salesforce про підготовку захисни…

Пітер Лінгтон, віце-президент з регіону в департаменті війни Salesforce, підкреслює трансформаційний вплив, який сучасні технології матимуть на Департамент Війни протягом наступних трьох-п’яти років.

Dec. 15, 2025, 9:35 a.m.

Стратегічна позиція Sprout Social у змінному ланд…

Sprout Social міцно закріпив за собою статус провідного гравця в індустрії управління соціальними мережами, активно впроваджуючи передові технології штучного інтелекту та укладаючи стратегічні партнерства, що сприяють інноваціям та розширенню сервісів.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today