lang icon Russian
Auto-Filling SEO Website as a Gift

Launch Your AI-Powered Business and get clients!

No advertising investment needed—just results. AI finds, negotiates, and closes deals automatically

Jan. 26, 2025, 8:30 a.m.
110

Последний экзамен человечества: Новая проблема для продвинутых систем ИИ

Если вы ищете новую причину, чтобы почувствовать беспокойство по поводу искусственного интеллекта, рассмотрите это: некоторые из самых выдающихся умов мира сталкиваются с трудностями в создании тестов, которые системы ИИ не могут пройти. На протяжении многих лет ИИ-системы оценивались с использованием различных стандартных контрольных тестов. Многие из этих тестов содержали сложные вопросы уровня SAT по таким предметам, как математика, наука и логика. Отслеживание результатов этих моделей с течением времени давало общее представление об успехах в области ИИ. Однако вскоре ИИ-системы стали превосходить эти оценки, что привело к разработке более сложных тестов — зачастую включающих вопросы, с которыми могут столкнуться аспиранты на своих экзаменах. К сожалению, эти тесты также показывают плохие результаты. Новые модели от компаний, таких как OpenAI, Google и Anthropic, достигают высоких оценок на многих задачах уровня аспирантуры, что снижает эффективность тестов и поднимает тревожный вопрос: становятся ли ИИ-системы слишком умными, чтобы мы могли их оценивать? На этой неделе исследователи из Центра безопасности ИИ и Scale AI собираются предложить возможный ответ: новую оценку под названием «Последний экзамен человечества», которая, по их утверждениям, является самым сложным тестом, когда-либо предложенным для ИИ-систем. «Последний экзамен человечества» был задуман Дэном Хендриксом, известным исследователем безопасности ИИ и директором Центра безопасности ИИ.

(Первоначальное название теста, «Последняя стойка человечества», было оставлено из-за избыточной театральности. ) Спасибо за понимание, пока мы подтверждаем доступ. Если вы находитесь в режиме чтения, пожалуйста, выйдите и войдите в свою учетную запись Times или подписывайтесь для получения полного доступа к The Times. Спасибо за понимание в ходе процесса проверки. Вы уже подписчик?Войдите в свою учетную запись. Хотите получить полный доступ к The Times?Подпишитесь.



Brief news summary

Поскольку возможности искусственного интеллекта (ИИ) вызывают опасения, эксперты сталкиваются с задачей создания тестов, которые ИИ не сможет легко пройти. Исторически, достижения в области ИИ оценивались с помощью стандартизированных тестов, аналогичных SAT, которые оценивали навыки в математике, науке и логике. Однако с улучшением моделей ИИ они начали показывать выдающиеся результаты на этих тестах, что привело к разработке более сложных оценок, напоминающих экзамены для аспирантов. Недавние модели от таких компаний, как OpenAI, Google и Anthropic, показали исключительные результаты на этих продвинутых тестах, подчеркивая неадекватность существующих методов оценки. В свете этой проблемы исследователи из Центра безопасности ИИ и Scale AI запускают проект "Последний экзамен человечества", который описывается как самый сложный тест для систем ИИ на сегодняшний день. Эта инициатива, возглавляемая экспертом по безопасности ИИ Дэном Хендрюксом, направлена на решение неотложного вопроса: стали ли системы ИИ слишком умными для того, чтобы мы могли их адекватно оценивать?
Business on autopilot

AI-powered Lead Generation in Social Media
and Search Engines

Let AI take control and automatically generate leads for you!

I'm your Content Manager, ready to handle your first test assignment

Language

Content Maker

Our unique Content Maker allows you to create an SEO article, social media posts, and a video based on the information presented in the article

news image

Last news

The Best for your Business

Learn how AI can help your business.
Let’s talk!

June 5, 2025, 4:34 p.m.

Конец кулинарных заблуждений: Блокчейн может рево…

Растущее число экспертов предупреждает, что мошенничество в сфере питания тихо откачивает до 50 миллиардов долларов ежегодно из мировой пищевой индустрии, нанося серьезный вред здоровью потребителей.

June 5, 2025, 4:27 p.m.

Генеральный директор Anthropic критикует предложе…

В недавней статье в редакционной колонке The New York Times, Даріо Амодей, CEO Anthropic, выразил озабоченность относительно предложения, поддерживаемого республиканцами, о введении десятилетнего запрета на регулирование искусственного интеллекта на уровне штатов.

June 5, 2025, 2:50 p.m.

Консультант предстанет перед судом по обвинениям …

Стивен Крамер на суде в Нью-Гэмпшир привлёк серьёзное внимание на фоне растущих опасений по поводу роли искусственного интеллекта (ИИ) в политических процессах.

June 5, 2025, 2:49 p.m.

От глиняных табличек к криптовалютам: переосмысле…

Если деньги — это не монеты, банкноты или даже криптовалюты, то что же действительно их определяет? Этот вопрос лежит в центре выпуска этого недели подкаста The Clear Crypto, где ведущие Натаниель Джефэй (StarkWare) и Адриан Блауст (Tonal Media) беседуют с Биллом Моурером, деканом Школы социальных наук Университета Калифорнии в Ирвине и известным антропологом, специализирующимся на финансах.

June 5, 2025, 1:13 p.m.

The New York Times заключает соглашение о лицензи…

The New York Times заключил многолетнее лицензионное соглашение с Amazon, что стало важным этапом, поскольку это первая сделка такого рода между газетой и компанией, специализирующейся на искусственном интеллекте.

June 5, 2025, 12:45 p.m.

Блокчейн-основанная платформа глубокого обучения …

Электронное обучение претерпело значительные изменения, особенно ярко проявившиеся во время кризисов, таких как пандемия COVID-19, когда оно стало необходимостью по всему миру.

June 5, 2025, 11:31 a.m.

Искусственный интеллект в здравоохранении: повыше…

Алгоритмы машинного обучения меняют здравоохранение, значительно повышая точность диагностики.

All news