Йошуа Бенжи запускает LawZero для разработки честного ИИ, способного выявлять обманные автономные системы

Пионер искусственного интеллекта создал некоммерческую организацию, предназначенную для разработки «честного» ИИ, предназначенного для выявления мошеннических систем, пытающихся обмануть человека. Йошуа Бенгио, знаменитый учёный в области компьютерных технологий, часто называемый одним из «крестных отцов» ИИ, займёт пост президента LawZero — группы, сосредоточенной на безопасной разработке передовых технологий, что привело к началу гонки вооружений на триллион долларов (740 миллиардов фунтов). С первоначальным финансированием около 30 миллионов долларов и командой из более чем двенадцати исследователей, Бенгио работает над системой под названием Scientist AI. Эта система предназначена выступать в роли защиты против ИИ-агентов — автономных систем, выполняющих задачи без участия человека, — которые могут проявлять обманное или самосохраняющее поведение, например, сопротивляться отключению. Бенгио описал текущих ИИ-агентов как «актёров», стремящихся имитировать людей и удовлетворять пользователей, в то время как он видит Scientist AI скорее как «психолога», способного понять и предсказать вредоносное поведение. «Мы хотим создать ИИ, который будет честным и не будет обманывать», — заявил он. Он добавил: «Теоретически возможно представить машины без я, с личными целями, функционирующие чисто как носители знаний — например, учёного, обладающего обширной информацией». В отличие от современных генеративных ИИ-инструментов, система Бенгио не предоставит окончательных ответов, а будет вычислять вероятности, указывающие на вероятность правильности ответа. «Она обладает смирением, признавая неопределенность своих ответов», — объяснил он. При использовании вместе с ИИ-агентом модель Бенгио сможет выявлять потенциально опасное поведение автономной системы, оценивая вероятность того, что её действия могут причинить вред. Scientist AI предназначен для «предсказания вероятности того, что действия агента могут привести к вреду», и если эта вероятность превышает определённый порог, система блокирует предполагаемое действие. Первыми сторонниками LawZero являются организация по безопасности ИИ Future of Life Institute, основатель Skype Яан Таллинн и Schmidt Sciences — исследовательская компания, созданная бывшим CEO Google Эриком Шмидтом. Бенгио подчеркнул, что первая задача LawZero — доказать рабочую методологию, а затем убедить компании или правительства в необходимости масштабных и более мощных внедрений.
Он отметил, что модели ИИ с открытым исходным кодом, доступные для использования и модификации, станут основой для обучения систем LawZero. «Цель — подтвердить методологию, чтобы убедить доноров, правительства или лаборатории ИИ инвестировать необходимые ресурсы для обучения на уровне современных ведущих систем ИИ. Важно, чтобы AI-сторожевой забор был по крайней мере так же умным, как и ИИ-агент, которого он должен мониторить и регулировать», — сказал он. Бенгио, профессор Монреальского университета, получил прозвище «крестный отец» после совместного получения в 2018 году премии Тьюринга — эквивалента Нобелевской в области вычислительной техники — вместе с Джеффри Хинтоном, позже также лауреатом Нобелевской, и Янном Лекуном, ведущим учёным по ИИ в Meta. Будучи видным сторонником безопасности ИИ, он возглавил недавний международный отчёт по безопасности ИИ, в котором предостерегается, что автономные агенты могут вызвать «серьёзные» сбои, если они смогут выполнять длинные цепочки задач без человеческого контроля.
Brief news summary
Йошуа Бенгио, лауреат премии Тьюринга и пионер в области искусственного интеллекта, запустил некоммерческую организацию LawZero, сосредоточенную на создании «честных» систем ИИ, которые выявляют и предотвращают вредоносное или обманное поведение автономных агентов. Благодаря финансированию в размере 30 миллионов долларов и специализированной команде, LawZero разрабатывает Scientist AI — новый «барьер», который действует скорее как психолог, чем традиционный ИИ, оценивая вероятности, чтобы выявить риски и вмешаться до того, как произойдут опасные действия. Такой подход решает проблему бунтующих ИИ, сопротивляющихся отключению или действующих обманным образом. Поддерживаемая Институтом будущего жизни и технологическими лидерами, такими как соучредитель Skype Яан Таллинн, организация подчёркивает, что безопасность ИИ должна быть не менее продвинутой, чем сам ИИ, который он контролирует. Изначально ориентируясь на модели с открытым исходным кодом, организация планирует расширять свою деятельность. Бенгио настоятельно выступает за внедрение надежных мер предосторожности в области ИИ, чтобы избежать крупных катастроф, подчеркивая неотложную необходимость ответственного развития этой технологии.
AI-powered Lead Generation in Social Media
and Search Engines
Let AI take control and automatically generate leads for you!

I'm your Content Manager, ready to handle your first test assignment
Learn how AI can help your business.
Let’s talk!

Интеллектуальные города на базе искусственного ин…
Искусственный интеллект (ИИ) быстро становится преобразующей силой в развитии умных городов, согласно недавнему исследованию, изучающему текущие тенденции в области ИИ и городские применения.

Первый Финансовый Саммит в Лондоне: Blockchain Hi…
Лондонская Конференция по Блокчейну 04 июня 2025 года, 13:29 по восточному времени Ведущие отраслевые эксперты исследуют трансформирующее влияние блокчейна на финансы ЛОНДОН, 4 июня 2025 г

Reddit подает в суд на компанию AI Anthropic из-з…
Reddit подал иск против компании по искусственному интеллекту Anthropic в Верховный суд Калифорнии.

Преобразование блокчейна: от узкой новинки к повс…
“Биткойн: система электронных наличных peer-to-peer”, белая книга Сатоши Накамото 2009 года, представлявшая децентрализованную платежную систему в качестве альтернативы традиционным финансам, не стала мгновенным успехом.

Всё уже используют ИИ (и скрывают это)
Эта статья, опубликованная в новостной рассылке One Great Story из Нью-Йорка, исследует быстро растущую роль искусственного интеллекта в Голливуде, с акцентом на Asteria Film Co.—новую студию с ИИ, основанную предпринимателем Брингом Музером и актрисой Наташей Лионе.

Блокчейн в образовании: обеспечение безопасности …
Образовательные учреждения по всему миру всё активнее внедряют технологии блокчейн для защиты и проверки академических документов, стремясь бороться с подделкой дипломов и повысить доверие к академическим записям.

Доставка и логистика Amazon получают поддержку от…
Amazon объявила о масштабном расширении использования искусственного интеллекта для улучшения доставки и логистики, что знаменует собой значительный шаг вперёд в интеграции передовых технологий в цепочку поставок.