Сингулярность искусственного интеллекта не заменит рабочие места в ближайшее время: исследование Карнеги-Меллон выявляет ограничения
Brief news summary
Недавние исследования показывают, что искусственный интеллект еще не близок к полной замене человеческих работников. Эксперимент Университета Карнеги-Меллона создал смоделированную софтверную компанию, полностью укомплектованную агентами ИИ, основанными на лучших моделях от Google, OpenAI, Anthropic и Meta. Эти агенты выполняли роли финансовых аналитиков, программистов и руководителей проектов, выполняя типичные задачи на рабочем месте, такие как управление файлами, экскурсии по офису и оценка эффективности работы. Однако итог прошёл в виде хаоса и разочарования. Самый способный ИИ — Claude 3.5 Sonnet от Anthropic — успешно справился всего с 24% задач, при этом требовал много шагов и был дорогостоящим, в то время как остальные показывали еще худшие результаты. Исследователи указывают на отсутствие у ИИ здравого смысла, социальных навыков, навыков навигации в интернете и тенденций к самообману как основные ограничения. В настоящее время ИИ действует скорее как продвинутый предиктивный текст, чем автономный решатель проблем. Несмотря на всю популярность, агенты ИИ далеки от возможности справляться с сложными человеческими профессиями, поэтому многие карьеры пока остаются в безопасности.Если вы беспокоились о том, что искусственный интеллект вскоре захватит все рабочие места и оставит вас без работы, то сейчас можете расслабиться, потому что ИИ не намерен заменять вашу профессию в ближайшее время. Не потому, что у него отсутствует желание — просто потому, что он пока этого не умеет. Недавний эксперимент, проведённый исследователями из Карнеги-Меллонского университета, создал фиктивную софтверную компанию, полностью укомплектованную агентами ИИ — моделями ИИ, предназначенными для автономного выполнения задач, — и результат получился комично хаотичным. Испытание под названием TheAgentCompany было наполнено искусственными работниками из Google, OpenAI, Anthropic и Meta. Эти агенты ИИ принимали на себя роли аналитиков, инженеров-программистов и менеджеров проектов, сотрудничая с имитированными коллегами, такими как фиктивный отдел кадров и технический директор. Чтобы оценить, насколько эти модели справляются в реалистичных условиях, исследователи поставили им задачи, имитирующие повседневные обязанности в реальной софтверной компании. Агентам ИИ предстояло ориентироваться в файловых структурах, виртуально осматривать новые офисные пространства и писать отзывы о работе инженеров на основе собранной обратной связи. Как впервые сообщила Business Insider, результаты оказались неутешительными. Самая успешная модель, Claude 3. 5 Sonnet от Anthropic, смогла выполнить лишь 24 процента поставленных задач.
Авторы исследования отметили, что даже этот умеренный успех достигался высокой ценой — в среднем почти 30 шагов и более 6 долларов за задачу. В свою очередь, Google Gemini 2. 0 Flash требовал в среднем 40 шагов на каждую выполненную работу, но при этом успешно справлялся всего в 11, 4 процента случаев, что делает его второй по эффективности моделью. Самой худшей оказалась Nova Pro v1 от Amazon, которая выполняла всего 1, 7 процента задач, при этом затрачивая почти 20 шагов на каждую. Исследователи предположили, что агентам мешали недостаток здравого смысла, плохие социальные навыки и слабое понимание того, как безопасно и эффективно пользоваться интернетом. Кроме того, у ботов возникали трудности с самодезориентацией — то есть они придумывали обходные пути, ведущие к полным провалам. Например, команда Карнеги-Меллон описала ситуацию, когда агент не смог определить правильного человека для вопросов через корпоративный чат, и попытался создать обходной путь, переименовав другого пользователя в нужного контакта. Хотя, по информации, ИИ-агенты могут хорошо справляться с малыми задачами, эти и другие исследования показывают, что они ещё далеки от готовности выполнять сложные работы, в которых сейчас преуспевают люди. Основная причина в том, что современный «искусственный интеллект», по сути, является лишь сложным расширением предиктивного текста вашего телефона — а не разумной сущностью, способной решать проблемы, учиться на опыте и применять знания в новых ситуациях. Короче говоря: несмотря на заявления крупных технокомпаний, машины совсем не собираются забрать ваши рабочие места в ближайшее время.
Watch video about
Сингулярность искусственного интеллекта не заменит рабочие места в ближайшее время: исследование Карнеги-Меллон выявляет ограничения
Try our premium solution and start getting clients — at no cost to you