lang icon Ukrainian
Auto-Filling SEO Website as a Gift

Launch Your AI-Powered Business and get clients!

No advertising investment needed—just results. AI finds, negotiates, and closes deals automatically

May 17, 2025, 9:16 p.m.
2

Новий дослідження виявляє, що штучний інтелект має труднощі з читанням аналогових годинників та обчисленнями дат у календарі

Нове дослідження визначило набір завдань, які людям легко дається, але штучному інтелекту (ШІ) викликають труднощі — зокрема, читання аналогові годинники та визначення дня тижня за заданою датою. Хоча ШІ може генерувати код, зображення, текст, схожий на людський, і навіть успішно складати іспити в різному ступені, він часто неправильно інтерпретує положення стрілок годинника та не справляється з базовою арифметикою календаря. Дослідження, представлене на Міжнародній конференції з представлення навчання (ICLR) 2025 року та опубліковане на препринт-сервісі arXiv (ще не рецензоване), підкреслює значні прогалини у можливостях ШІ виконувати завдання, з якими добре справляються люди ще у ранньому віці. Головний автор Рохіт Саксена з Единбурзького університету наголосив, що ці недоліки потрібно усунути, щоб ефективно застосовувати ШІ у сферах, чутливих до часу й реальних умов, таких як планування, автоматизація та допоміжні технології. Дослідники протестували різні мультимодальні великі мовні моделі (MLLM), зокрема Llama 3. 2-Vision від Meta, Claude-3. 5 Sonnet від Anthropic, Gemini 2. 0 від Google та GPT-4o від OpenAI, використовуючи спеціально створений набір даних із зображеннями годинників і календарів. Моделі неправильно визначали час на годинниках або день тижня за вибірковими датами у більш ніж половині випадків: точність становила лише 38, 7% для годинників і 26, 3% для завдань з календарями. Саксена пояснив, що погане зчитування ШІ з годинників виникає через відсутність просторового мислення — задач, які вимагають розпізнавання накладених стрілок, вимірювання кутів та інтерпретації різних дизайнів годинників, наприклад, із римськими цифрами або стилізованими циферблатами. Визначити, що зображення є годинником, для ШІ легше, ніж точно його прочитати.

Аналогічно, хоча арифметика є фундаментальною для обчислень, великі мовні моделі не виконують обчислень за допомогою алгоритмів, а передбачають вихідні дані на основі шаблонів у тренувальних даних. Це спричиняє нерегулярне та непослідовне логічне мислення, що пояснює високий рівень помилок у обчисленнях, пов’язаних із датами. Це дослідження додає до зростаючих доказів того, що спосіб “розуміння” ШІ суттєво відрізняється від людської когніції. ШІ досягає гарних результатів, коли має багато прикладів для навчання, але має труднощі з абстрактним мисленням і узагальненням, особливо у завданнях, що поєднують сприйняття з точним логічним висновком. Крім того, обмежені дані щодо рідкісних явищ, таких як високосні роки, ускладнюють його роботу, оскільки ШІ не здатен зробити необхідні концептуальні зв’язки. Отже, результати підкреслюють необхідність створення більш багатих і цілеспрямованих датасетів і перегляду здатності ШІ інтегрувати логічне й просторове мислення, а також обережність у надмірній довірі результатам ШІ у складних завданнях. Саксена наголосив, що потрібно проводити ретельне тестування, впроваджувати запасні механізми та часто залучати людину для контролю, коли ШІ використовується для поєднання сприйняття та точного логічного розрахунку.



Brief news summary

Нове дослідження, представлене на Міжнародній конференції з представлення знань 2025 року, висвітлює значні обмеження сучасних моделей ШІ, таких як Llama 3.2-Vision від Meta, Claude-3.5 Sonnet від Anthropic, Gemini 2.0 від Google та GPT-4o від OpenAI. Незважаючи на недавні досягнення, ці моделі зіштовхуються з труднощами щодо завдань, які є простими для людей, таких як читання аналогових годинників і визначення днів тижня за датами. Дослідження показало, що ці моделі правильно інтерпретували час на годиннику лише у 38,7% випадків, а дати у календарі — лише у 26,3%, що підкреслює їхню залежність від розпізнавання зразків, а не справжнього мислення. Проведене на чолі з Рохітом Саксеной з Единбурзького університету, дослідження виявило, що хоча системи ШІ можуть точно ідентифікувати об'єкти, вони стикаються з суттєвими труднощами при складних завданнях з просторового й логічного мислення, особливо при розв’язанні нестандартних ситуацій, таких як високосні роки. Результати підкреслюють необхідність нових методів навчання, які б інтегрували навички логічного й просторового мислення, а також попереджають про надмірну залежність від ШІ у задачах, що вимагають точних обчислень. В підсумку, дослідження акцентує на фундаментальній різниці між людською когніцією та розпізнаванням шаблонів у ШІ та advocates за всебічну перевірку та людський контроль у часозалежних реальних застосуваннях.
Business on autopilot

AI-powered Lead Generation in Social Media
and Search Engines

Let AI take control and automatically generate leads for you!

I'm your Content Manager, ready to handle your first test assignment

Language

Content Maker

Our unique Content Maker allows you to create an SEO article, social media posts, and a video based on the information presented in the article

news image

Last news

The Best for your Business

Learn how AI can help your business.
Let’s talk!

May 18, 2025, 2:59 a.m.

Nvidia отримує поштовх у сфері штучного інтелекту…

Наступне бойове поле у гонці озброєнь штучним інтелектом уже не Пекін — це Ер-Ріяд, принаймні, за словами Wedbush.

May 18, 2025, 2:23 a.m.

Громадський інтернет — це вузьке місце для блокче…

За словами Аустіна Федера, співзасновника та генерального директора DoubleZero — проекту, спрямованого на розробку високошвидкісних волоконно-оптичних каналів зв’язку для блокчейнів, громадська інтернет-інфраструктура є основним вузьким місцем швидкості та продуктивності для високопродуктивних мереж блокчейнів.

May 18, 2025, 1:30 a.m.

Shoosmiths заохочує впровадження штучного інтелек…

На початку минулого місяця компанія Shoosmiths, британська юридична фірма з 1500 працівниками, оголосила про створення бонусного фонду у розмірі 1 мільйона фунтів стерлінгів, який буде розподілений серед співробітників, якщо вони колективно впровадять в свої робочі процеси інструмент штучного інтелекту Microsoft Copilot.

May 18, 2025, 12:37 a.m.

JP Morgan здійснює першу токенізовану казначейськ…

JP Morgan завершила свою першу транзакцію на публічному блокчейні, що свідчить про зростаючу участь фінансового гіганта у екосистемі Web3.

May 18, 2025, 12:13 a.m.

Змішні чіпи штучного інтелекту стають новою «моне…

© 2025 Fortune Media IP Limited.

May 17, 2025, 11:10 p.m.

Центральні банки досліджують блокчейн для модерні…

Центральні банки починають досліджувати, як програмовані блокчейн-технології можуть трансформувати реалізацію монетарної політики.

May 17, 2025, 10:51 p.m.

Показ ІІ-ефектів у "Зоряних війнах" був повним пр…

Якщо керівництво Disney матиме свій шлях, нас будуть завалювати нескінченними ребутами, сиквелами та спін-оффами "Зоряних війн" аж поки Сонце не вибухне.

All news