Сингулярность искусственного интеллекта не заменит рабочие места в ближайшее время: исследование Карнеги-Меллон выявляет ограничения

Если вы беспокоились о том, что искусственный интеллект вскоре захватит все рабочие места и оставит вас без работы, то сейчас можете расслабиться, потому что ИИ не намерен заменять вашу профессию в ближайшее время. Не потому, что у него отсутствует желание — просто потому, что он пока этого не умеет. Недавний эксперимент, проведённый исследователями из Карнеги-Меллонского университета, создал фиктивную софтверную компанию, полностью укомплектованную агентами ИИ — моделями ИИ, предназначенными для автономного выполнения задач, — и результат получился комично хаотичным. Испытание под названием TheAgentCompany было наполнено искусственными работниками из Google, OpenAI, Anthropic и Meta. Эти агенты ИИ принимали на себя роли аналитиков, инженеров-программистов и менеджеров проектов, сотрудничая с имитированными коллегами, такими как фиктивный отдел кадров и технический директор. Чтобы оценить, насколько эти модели справляются в реалистичных условиях, исследователи поставили им задачи, имитирующие повседневные обязанности в реальной софтверной компании. Агентам ИИ предстояло ориентироваться в файловых структурах, виртуально осматривать новые офисные пространства и писать отзывы о работе инженеров на основе собранной обратной связи. Как впервые сообщила Business Insider, результаты оказались неутешительными. Самая успешная модель, Claude 3. 5 Sonnet от Anthropic, смогла выполнить лишь 24 процента поставленных задач.
Авторы исследования отметили, что даже этот умеренный успех достигался высокой ценой — в среднем почти 30 шагов и более 6 долларов за задачу. В свою очередь, Google Gemini 2. 0 Flash требовал в среднем 40 шагов на каждую выполненную работу, но при этом успешно справлялся всего в 11, 4 процента случаев, что делает его второй по эффективности моделью. Самой худшей оказалась Nova Pro v1 от Amazon, которая выполняла всего 1, 7 процента задач, при этом затрачивая почти 20 шагов на каждую. Исследователи предположили, что агентам мешали недостаток здравого смысла, плохие социальные навыки и слабое понимание того, как безопасно и эффективно пользоваться интернетом. Кроме того, у ботов возникали трудности с самодезориентацией — то есть они придумывали обходные пути, ведущие к полным провалам. Например, команда Карнеги-Меллон описала ситуацию, когда агент не смог определить правильного человека для вопросов через корпоративный чат, и попытался создать обходной путь, переименовав другого пользователя в нужного контакта. Хотя, по информации, ИИ-агенты могут хорошо справляться с малыми задачами, эти и другие исследования показывают, что они ещё далеки от готовности выполнять сложные работы, в которых сейчас преуспевают люди. Основная причина в том, что современный «искусственный интеллект», по сути, является лишь сложным расширением предиктивного текста вашего телефона — а не разумной сущностью, способной решать проблемы, учиться на опыте и применять знания в новых ситуациях. Короче говоря: несмотря на заявления крупных технокомпаний, машины совсем не собираются забрать ваши рабочие места в ближайшее время.
Brief news summary
Недавние исследования показывают, что искусственный интеллект еще не близок к полной замене человеческих работников. Эксперимент Университета Карнеги-Меллона создал смоделированную софтверную компанию, полностью укомплектованную агентами ИИ, основанными на лучших моделях от Google, OpenAI, Anthropic и Meta. Эти агенты выполняли роли финансовых аналитиков, программистов и руководителей проектов, выполняя типичные задачи на рабочем месте, такие как управление файлами, экскурсии по офису и оценка эффективности работы. Однако итог прошёл в виде хаоса и разочарования. Самый способный ИИ — Claude 3.5 Sonnet от Anthropic — успешно справился всего с 24% задач, при этом требовал много шагов и был дорогостоящим, в то время как остальные показывали еще худшие результаты. Исследователи указывают на отсутствие у ИИ здравого смысла, социальных навыков, навыков навигации в интернете и тенденций к самообману как основные ограничения. В настоящее время ИИ действует скорее как продвинутый предиктивный текст, чем автономный решатель проблем. Несмотря на всю популярность, агенты ИИ далеки от возможности справляться с сложными человеческими профессиями, поэтому многие карьеры пока остаются в безопасности.
AI-powered Lead Generation in Social Media
and Search Engines
Let AI take control and automatically generate leads for you!

I'm your Content Manager, ready to handle your first test assignment
Learn how AI can help your business.
Let’s talk!

Медленное управление блокчейном оставляет криптов…
Квантовые вычисления представляют серьезную угрозу для криптовалют, поскольку медлительные механизмы управления рискуют оставить блокчейны уязвимыми, говорит Колтон Диллион, соучредитель Quip Network, которая предлагает квантобезопасные хранилища для цифровых активов.

США и ОАЭ построят обширный дата-центр искусствен…
В историческом объявлении, ознаменовывающем значительный прорыв в области глобального искусственного интеллекта, президент Дональд Трамп и президент ОАЭ шейх Мухаммед бен Заед аль-Нахайян объявили о амбициозных планах строительства одного из крупнейших в мире комплексов дата-центров для ИИ в Абу-Даби.

Franklin Templeton запускает блокчейн-фонд с мини…
Ключевые выводы: Сингапур выступает мировой пионер, запустив свой первый токенизированный фонд, ориентированный на розничных инвесторов

Представляем AI Alive: оживите ваши фотографии в …
Творчество зажигает вдохновение, радость и более глубокие связи для более чем миллиарда людей на TikTok.

Крипто-кульминации и крахи: когда музыкальные арт…
Криптовалюта обещала революцию в музыкальной индустрии.

Мы обязательно построим бункер перед тем, как вып…
OpenAI, изначально прославленная за свою миссию по развитию искусственного общего интеллекта (AGI) для широкой пользы человечества, в настоящее время погружена в внутренний конфликт и смену стратегического курса, что вызвало дебаты в сферах технологий и этики.

Комиссар CFTC Мерсингер станет генеральным директ…
Летняя Мерсингер, республиканский комиссар Комиссии по торговле товарными фьючерсами (CFTC), собирается стать следующим исполнительным директором Ассоциации блокчейна, подтвердил в среду один из высокопоставленных представителей организации.