News
>
Новий дослідження виявляє, що штучний інтелект має труднощі з читанням аналогових годинників та обчисленнями дат у календарі

Auto-Filling SEO Website as a Gift

Launch Your AI-Powered Business and get clients!

No advertising investment needed—just results. AI finds, negotiates, and closes deals automatically

May 17, 2025, 9:16 p.m.

Новий дослідження виявляє, що штучний інтелект має труднощі з читанням аналогових годинників та обчисленнями дат у календарі

Нове дослідження визначило набір завдань, які людям легко дається, але штучному інтелекту (ШІ) викликають труднощі — зокрема, читання аналогові годинники та визначення дня тижня за заданою датою. Хоча ШІ може генерувати код, зображення, текст, схожий на людський, і навіть успішно складати іспити в різному ступені, він часто неправильно інтерпретує положення стрілок годинника та не справляється з базовою арифметикою календаря. Дослідження, представлене на Міжнародній конференції з представлення навчання (ICLR) 2025 року та опубліковане на препринт-сервісі arXiv (ще не рецензоване), підкреслює значні прогалини у можливостях ШІ виконувати завдання, з якими добре справляються люди ще у ранньому віці. Головний автор Рохіт Саксена з Единбурзького університету наголосив, що ці недоліки потрібно усунути, щоб ефективно застосовувати ШІ у сферах, чутливих до часу й реальних умов, таких як планування, автоматизація та допоміжні технології. Дослідники протестували різні мультимодальні великі мовні моделі (MLLM), зокрема Llama 3. 2-Vision від Meta, Claude-3. 5 Sonnet від Anthropic, Gemini 2. 0 від Google та GPT-4o від OpenAI, використовуючи спеціально створений набір даних із зображеннями годинників і календарів. Моделі неправильно визначали час на годинниках або день тижня за вибірковими датами у більш ніж половині випадків: точність становила лише 38, 7% для годинників і 26, 3% для завдань з календарями. Саксена пояснив, що погане зчитування ШІ з годинників виникає через відсутність просторового мислення — задач, які вимагають розпізнавання накладених стрілок, вимірювання кутів та інтерпретації різних дизайнів годинників, наприклад, із римськими цифрами або стилізованими циферблатами. Визначити, що зображення є годинником, для ШІ легше, ніж точно його прочитати.

Аналогічно, хоча арифметика є фундаментальною для обчислень, великі мовні моделі не виконують обчислень за допомогою алгоритмів, а передбачають вихідні дані на основі шаблонів у тренувальних даних. Це спричиняє нерегулярне та непослідовне логічне мислення, що пояснює високий рівень помилок у обчисленнях, пов’язаних із датами. Це дослідження додає до зростаючих доказів того, що спосіб “розуміння” ШІ суттєво відрізняється від людської когніції. ШІ досягає гарних результатів, коли має багато прикладів для навчання, але має труднощі з абстрактним мисленням і узагальненням, особливо у завданнях, що поєднують сприйняття з точним логічним висновком. Крім того, обмежені дані щодо рідкісних явищ, таких як високосні роки, ускладнюють його роботу, оскільки ШІ не здатен зробити необхідні концептуальні зв’язки. Отже, результати підкреслюють необхідність створення більш багатих і цілеспрямованих датасетів і перегляду здатності ШІ інтегрувати логічне й просторове мислення, а також обережність у надмірній довірі результатам ШІ у складних завданнях. Саксена наголосив, що потрібно проводити ретельне тестування, впроваджувати запасні механізми та часто залучати людину для контролю, коли ШІ використовується для поєднання сприйняття та точного логічного розрахунку.

News source

Brief news summary

Нове дослідження, представлене на Міжнародній конференції з представлення знань 2025 року, висвітлює значні обмеження сучасних моделей ШІ, таких як Llama 3.2-Vision від Meta, Claude-3.5 Sonnet від Anthropic, Gemini 2.0 від Google та GPT-4o від OpenAI. Незважаючи на недавні досягнення, ці моделі зіштовхуються з труднощами щодо завдань, які є простими для людей, таких як читання аналогових годинників і визначення днів тижня за датами. Дослідження показало, що ці моделі правильно інтерпретували час на годиннику лише у 38,7% випадків, а дати у календарі — лише у 26,3%, що підкреслює їхню залежність від розпізнавання зразків, а не справжнього мислення. Проведене на чолі з Рохітом Саксеной з Единбурзького університету, дослідження виявило, що хоча системи ШІ можуть точно ідентифікувати об'єкти, вони стикаються з суттєвими труднощами при складних завданнях з просторового й логічного мислення, особливо при розв’язанні нестандартних ситуацій, таких як високосні роки. Результати підкреслюють необхідність нових методів навчання, які б інтегрували навички логічного й просторового мислення, а також попереджають про надмірну залежність від ШІ у задачах, що вимагають точних обчислень. В підсумку, дослідження акцентує на фундаментальній різниці між людською когніцією та розпізнаванням шаблонів у ШІ та advocates за всебічну перевірку та людський контроль у часозалежних реальних застосуваннях.

Business on autopilot

AI-powered Lead Generation in Social Media
and Search Engines

Let AI take control and automatically generate leads for you!

I'm your Content Manager, ready to handle your first test assignment

Language

Learn how AI can help your business.
Let’s talk!

May 18, 2025, 2:59 a.m.

Nvidia отримує поштовх у сфері штучного інтелекту…

Наступне бойове поле у гонці озброєнь штучним інтелектом уже не Пекін — це Ер-Ріяд, принаймні, за словами Wedbush.

May 18, 2025, 2:23 a.m.

Громадський інтернет — це вузьке місце для блокче…

За словами Аустіна Федера, співзасновника та генерального директора DoubleZero — проекту, спрямованого на розробку високошвидкісних волоконно-оптичних каналів зв’язку для блокчейнів, громадська інтернет-інфраструктура є основним вузьким місцем швидкості та продуктивності для високопродуктивних мереж блокчейнів.

May 18, 2025, 1:30 a.m.

Shoosmiths заохочує впровадження штучного інтелек…

На початку минулого місяця компанія Shoosmiths, британська юридична фірма з 1500 працівниками, оголосила про створення бонусного фонду у розмірі 1 мільйона фунтів стерлінгів, який буде розподілений серед співробітників, якщо вони колективно впровадять в свої робочі процеси інструмент штучного інтелекту Microsoft Copilot.

May 18, 2025, 12:37 a.m.

JP Morgan здійснює першу токенізовану казначейськ…

JP Morgan завершила свою першу транзакцію на публічному блокчейні, що свідчить про зростаючу участь фінансового гіганта у екосистемі Web3.

May 18, 2025, 12:13 a.m.

Змішні чіпи штучного інтелекту стають новою «моне…

May 17, 2025, 11:10 p.m.

Центральні банки досліджують блокчейн для модерні…

Центральні банки починають досліджувати, як програмовані блокчейн-технології можуть трансформувати реалізацію монетарної політики.

May 17, 2025, 10:51 p.m.

Показ ІІ-ефектів у "Зоряних війнах" був повним пр…

Якщо керівництво Disney матиме свій шлях, нас будуть завалювати нескінченними ребутами, сиквелами та спін-оффами "Зоряних війн" аж поки Сонце не вибухне.

All news

Launch Your AI-Powered Business and get clients!

Новий дослідження виявляє, що штучний інтелект має труднощі з читанням аналогових годинників та обчисленнями дат у календарі

News source

Brief news summary

AI-powered Lead Generation in Social Media
and Search Engines

I'm your Content Manager, ready to handle your first test assignment

Content Maker

Last news

Гонка озброєнь Штучним Інтелектом переміщується до Ер-Ріяда з американсько-саудівським технологічним форумом та вагомими оновленнями у галузі

Голова DoubleZero Остіна Федера наголошує на публічному інтернеті як на вузькому місці для блокчейну

Юридична фірма Shoosmiths стимулює впровадження штучного інтелекту – бонус у розмірі 1 мільйон фунтів за інтеграцію Microsoft Copilot

The Best for your Business

Learn how AI can help your business.
Let’s talk!

Nvidia отримує поштовх у сфері штучного інтелекту…

Громадський інтернет — це вузьке місце для блокче…

Shoosmiths заохочує впровадження штучного інтелек…

JP Morgan здійснює першу токенізовану казначейськ…

Змішні чіпи штучного інтелекту стають новою «моне…

Центральні банки досліджують блокчейн для модерні…

Показ ІІ-ефектів у "Зоряних війнах" був повним пр…

Sales

Marketing

Customer Service

Launch Your AI-Powered Business and get clients!

Новий дослідження виявляє, що штучний інтелект має труднощі з читанням аналогових годинників та обчисленнями дат у календарі

News source

Brief news summary

AI-powered Lead Generation in Social Media and Search Engines

I'm your Content Manager, ready to handle your first test assignment

Content Maker

Last news

Гонка озброєнь Штучним Інтелектом переміщується до Ер-Ріяда з американсько-саудівським технологічним форумом та вагомими оновленнями у галузі

Голова DoubleZero Остіна Федера наголошує на публічному інтернеті як на вузькому місці для блокчейну

Юридична фірма Shoosmiths стимулює впровадження штучного інтелекту – бонус у розмірі 1 мільйон фунтів за інтеграцію Microsoft Copilot

The Best for your Business

Learn how AI can help your business. Let’s talk!

Nvidia отримує поштовх у сфері штучного інтелекту…

Громадський інтернет — це вузьке місце для блокче…

Shoosmiths заохочує впровадження штучного інтелек…

JP Morgan здійснює першу токенізовану казначейськ…

Змішні чіпи штучного інтелекту стають новою «моне…

Центральні банки досліджують блокчейн для модерні…

Показ ІІ-ефектів у "Зоряних війнах" був повним пр…

Your News is ready

Your article is ready

Generating video takes longer than text.

Join our community of experts

Reasons why you should be part of the experts community

Welcome to Neuron Expert!

Launch Your AI-Powered Business

Auto-Filling SEO Website as a Gift

AI Marketing Across All Social Media

AI Sales Manager + CRM

Support

Content Maker

Topic

Specify the topic (Optional)

Link (Optional)

Learn how to craft press releases, create unique social media posts, write SEO-optimized articles for websites, and produce videos, all from a single source

AI-powered Lead Generation in Social Media
and Search Engines

Learn how AI can help your business.
Let’s talk!