Новое исследование показывает, что искусственный интеллект испытывает трудности с чтением аналоговых часов и вычислением дат в календаре

Новое исследование выявило набор задач, с которыми люди справляются без особых усилий, а искусственный интеллект (ИИ) испытывает трудности — особенно чтение аналоговых часов и определение дня недели по заданной дате. Хотя ИИ умеет генерировать код, изображения, текст, похожий на человеческий, и даже сдавать экзамены в разной степени, он часто неправильно интерпретирует расположение стрелок на часах и не справляется с простыми арифметическими операциями с календарем. Об этом исследовании, представленном на Международной конференции по изучению представлений в 2025 году (ICLR) и опубликованном на пред-print сервере arXiv (еще не прошедшем рецензирование), говорится, что в способностях ИИ есть значительные пробелы в выполнении задач, которые люди осваивают уже в раннем возрасте. Ведущий автор — Рохит Сакшена из Эдинбургского университета — подчеркнул, что эти недостатки необходимо устранить для эффективного применения ИИ в срочных и реальных ситуациях, таких как планирование, автоматизация и вспомогательные технологии. Исследователи протестировали различные мультимодальные языковые модели (MLLM), включая Llama 3. 2-Vision от Meta, Claude-3. 5 Sonnet от Anthropic, Gemini 2. 0 от Google и GPT-4o от OpenAI, используя специально подготовленный набор данных с изображениями часов и календарей. Модели больше половины времени не справлялись с правильным определением времени на часах или дня недели по заданным датам — точность составила всего 38, 7% для часов и 26, 3% для задач, связанных с календарем. Сакшена объяснил, что плохое распознавание времени на часах у ИИ связано с недостатком пространственного мышления — задач, требующих обнаружения пересекающихся стрелок, измерения углов и интерпретации различных конструкций часов, например, с римскими цифрами или стилизованными циферблатами. Распознать изображение как часы для ИИ проще, чем точно прочитать время. Аналогично, несмотря на то что арифметика является фундаментальной для вычислений, крупные языковые модели не выполняют вычисления посредством алгоритмов — они предсказывают ответы на основе паттернов в обучающих данных.
Это приводит к непоследовательным и нелогичным рассуждениям, что объясняет высокие показатели ошибок при вычислениях, связанных с датами. Это исследование добавляет к постоянно растущему массиву доказательств того, что «понимание» ИИ принципиально отличается от человеческого мышления. ИИ хорошо справляется при наличии большого количества обучающих примеров, но испытывает трудности с абстрактным мышлением и обобщением, особенно в задачах, сочетающих восприятие и точную логику. Кроме того, ограниченность данных о редких явлениях, таких как високосные годы, мешает его эффективности, ведь ИИ не способен строить необходимые концептуальные связи. Результаты подчеркивают необходимость более богатых и целенаправленных датасетов, а также пересмотра возможностей ИИ по интеграции логического и пространственного мышления. Они также указывают на риск чрезмерной зависимости от результатов ИИ в сложных задачах. Сакшена подчеркнул важность строгих тестов, разработку резервных механизмов и часто необходимого человеческого контроля при использовании ИИ в ситуациях, требующих сочетания восприятия и точной логики.
Brief news summary
Новые исследования, представленные на Международной конференции по представлениям обучения 2025 года, выявляют значительные ограничения современных моделей искусственного интеллекта, таких как Llama 3.2-Vision от Meta, Claude-3.5 Sonnet от Anthropic, Gemini 2.0 от Google и GPT-4o от OpenAI. Несмотря на недавние достижения, эти модели испытывают трудности с задачами, которые для человека являются простыми, например, чтение аналоговых часов и определение дня недели по дате. Исследование показало, что эти модели правильно интерпретировали время на часах всего в 38,7% случаев, а даты в календаре — всего в 26,3%, что подчеркивает их зависимость от распознавания шаблонов, а не от настоящего логического мышления. Руководимая Рохитом Саксена из Эдинбургского университета, эта работа показывает, что хотя системы ИИ могут точно распознавать объекты, у них есть заметные сложности с задачами сложного пространственного и логического мышления, особенно при работе с редкими событиями, такими как високосные годы. Выводы подчеркивают необходимость внедрения новых методов обучения, которые объединяют навыки логического и пространственного мышления, а также предостерегают от чрезмерной зависимости от ИИ в задачах, требующих точных вычислений. В конечном итоге, исследование подчеркивает фундаментальные различия между человеческим мышлением и распознаванием шаблонов ИИ, выступая за всестороннюю проверку и человеческий контроль в задачах, чувствительных к времени, в реальном мире.
AI-powered Lead Generation in Social Media
and Search Engines
Let AI take control and automatically generate leads for you!

I'm your Content Manager, ready to handle your first test assignment
Learn how AI can help your business.
Let’s talk!

Nvidia получает подъем в области искусственного и…
Следующее поле боя в гонке вооружений искусственным интеллектом — не Пекин, а Эр-Рияд, по крайней мере, согласно Wedbush.

Общедоступный интернет — это узкое место для блок…
По словам Остина Федеры, соучредителя и CEO проекта DoubleZero — проекта, нацеленного на разработку высокоскоростных оптоволоконных коммуникационных каналов для блокчейнов — основным узким местом скорости и производительности высокопроходимых блокчейн-сетей является инфраструктура публичного интернета.

Shoosmiths стимулирует внедрение ИИ с помощью бон…
В начале прошлого месяца компания Shoosmiths, британская юридическая фирма с численностью сотрудников 1500 человек, объявила о создании бонусного фонда в размере миллиона фунтов стерлингов, который будет распределен между сотрудниками, если они коллективно интегрируют в свою работу инструмент искусственного интеллекта Microsoft Copilot.

JP Morgan завершает первую токенизированную казна…
JP Morgan завершила свою первую сделку на публичном блокчейне, что свидетельствует о растущем участии финансового гиганта в экосистеме Web3.

ИИ-чипы становятся новой «монетой в обращении», п…
© 2025 Fortune Media IP Limited.

Центральные банки исследуют блокчейн для модерниз…
Центральные банки начинают изучать, как программируемые технологии блокчейн могут трансформировать реализацию денежно-кредитной политики.

Шоу-энд-экзамен "Звёздных войн" с использованием …
Если руководство Disney продолжит в том же духе, нас ждёт нескончаемый поток римейков, продолжений и спин-оффов "Звёздных Войн", пока Солнце не взорвётся.