Ново изследване разкрива, че изкуственият интелект има затруднения при разчитането на аналогови часовници и при изчисляването на дати в календара

Ново изследване идентифицира набор от задачи, с които човешките същества се справят без усилия, но изкуственият интелект (ИИ) изпитва затруднения — по-специално четенето на аналогови часовници и определянето на деня от седмицата за дадена дата. Въпреки че ИИ може да генерира код, изображения, текст, подобен на човешки, и дори да преминава изпити в различна степен, той често връща грешни интерпретации на позициите на часовниковите стрелки и пропуска основни календарни операции. Проучването беше представено на Международната конференция по представяне на ученето (ICLR) 2025 и публикувано на сървъра за предварителни публикации arXiv (все още без рецензия), като подчертава значителни пропуски в способността на ИИ да извършва задачи, които хората усвояват още рано в живота. Водещият автор Рохит Саксена от Единбургския университет подчерта, че тези недостатъци трябва да бъдат адресирани, за да може ИИ ефективно да бъде използван в ситуации, изискващи бързи реакции и реално приложение, като графици, автоматизация и асистивни технологии. Изследователите тестваха различни мултимодални големи езикови модели (MLLMs)—включително Llama 3. 2-Vision на Meta, Claude-3. 5 Sonnet на Anthropic, Gemini 2. 0 на Google и GPT-4o на OpenAI—като използваха специално създаден набор от данни с изображения на часовници и календари. Моделите не успяха правилно да идентифицират времето на часовниците или да определят деня от седмицата за примерни дати повече от половината време, като точността им беше само 38, 7% при часовниците и 26, 3% при календарните задачи. Саксена обясни, че слабостта на ИИ при четенето на часове произхожда от липсата на пространствено мислене—задачи, които изискват разпознаване на препокриващи се стрелки, измерване на ъгли и интерпретиране на различни дизайни на часовници, като римски цифри или стилизирани циферблати. Разпознаването на изображение като часовник е по-лесно за ИИ, отколкото точното му четене.
По същия начин, макар аритметиката да е фундаментална за компютрите, големите езикови модели не извършват изчисления чрез алгоритми; 대신 те предсказват резултати въз основа на модели в обучителните данни. Това води до несигурно и неправилно reasoning, което обяснява високите проценти на неуспех при датени операции. Това изследване допринася за все по-широко разпространяващите се доказателства, че начинът, по който ИИ „разбира“, се различава фундаментално от човешкото мислене. ИИ се справя добре, когато разполага с множество обучителни примери, но среща затруднения при абстрактно мислене и обобщаване, особено при задачи, които съчетават възприятие и точна логика. Освен това, ограничените данни за по-редки явления като високосните години затрудняват представянето, тъй като ИИ не успява да направи необходимите концептуални връзки. Резултатите подчертават необходимостта от по-богати, целенасочени набори от данни и преоценка на способността на ИИ да интегрира логическо и пространствено мислене, като същевременно се посочват рискове от прекалено доверяване на изходите от ИИ при сложни задачи. Саксена акцентира върху важността на строги тестове, механизми за fallback и често човешко ръководство, когато ИИ е натоварен със задачи, изискващи съчетание от възприятие и прецизно reasoning.
Brief news summary
Новите изследвания, представени на Международната конференция по представяне на знания през 2025 г., подчертават значителните ограничения на съвременните модели за изкуствен интелект като Meta’s Llama 3.2-Vision, Anthropic’s Claude-3.5 Sonnet, Google’s Gemini 2.0 и OpenAI’s GPT-4o. Въпреки последните напредъци, тези модели се затрудняват с задачи, които са елементарни за човек, като четене на аналогови часовници и определяне на работните дни от дати. Проучването установи, че тези модели правилно интерпретират времето на часовника само 38,7% от случаите и датите в календара едва 26,3%, подчертавайки тяхната зависимост от разпознаването на модели, а не от истинско логическо мислене. Водено от Рохит Саксена от Единбургския университет, изследването разкрива, че докато системите за изкуствен интелект могат точно да разпознават обекти, имат сериозни проблеми със сложни пространствени и логически задачи, особено при необичайни събития като високосните години. Резултатите подчертават необходимостта от нови методи за обучение, които интегрират логически и пространствени умения, и предупреждават срещу прекомерната зависимост от ИИ при задачи, изискващи прецизни изчисления. В крайна сметка, проучването акцентира върху фундаменталните разлики между човешкото мислене и разпознаването по модели в изкуствения интелект, като препоръчва цялостна валидация и човешки контрол в приложения с времево чувствителен характер.
AI-powered Lead Generation in Social Media
and Search Engines
Let AI take control and automatically generate leads for you!

I'm your Content Manager, ready to handle your first test assignment
Learn how AI can help your business.
Let’s talk!

Нvidia получава тласък с изкуствен интелект, Meta…
Следващият бойно поле в надпреварата за власт в ИИ не е Пекин – поне според Wedbush, а Рияд.

Общият интернет е леща за блокчейн технологиите —…
Според Остин Федера, съосновател и изпълнителен директор на DoubleZero – проект, фокусиран върху разработването на високоскоростни оптични комуникационни релси за блокчейни, публичната интернет инфраструктура е основният фактор за забавяне в скоростта и представянето на високопроизводителните блокчейн мрежи.

Шусмитс поощрява внедряването на изкуствен интеле…
В началото на миналия месец Shoosmiths, британска адвокатска кантора с 1500 служители, обяви бонусен фонд от 1 милион паунда, който да бъде разпределен между персонала, ако те колективно възприемат AI инструмента на Microsoft, Copilot, в своите работни процеси.

JP Morgan урежда първата токенизирана транзакция …
JP Morgan завърши първата си транзакция на публичен блокчейн, което сигнализира за нарастващото ангажиране на финансовия гигант с екосистемата Web3.

Изкуствените интелектуални чипове са новата „валу…
© 2025 Fortune Media IP Limited.

Централните банки изследват блокчейн технологията…
Централните банки започват да изследват как програмируемите блокчейн технологии биха могли да трансформират прилагането на паричната политика.

Изложбата на специалните ефекти с изкуствен интел…
Ако ръководството на Disney има свое мнение, ние ще бъдем залети с безброй римейкове, продължения и спинофи на „Междузвездни войни“ до момента, в който Слънцето евентуално избухне.