Un nou estudi revela que la IA té dificultats amb la lectura d'ules analògics i els càlculs de dates del calendari

Una nova investigació ha identificat un conjunt de tasques que els humans gestionen amb facilitat, però amb les quals la intel·ligència artificial (IA) té més dificultats—concretament llegir rellotges d’analogues i determinar el dia de la setmana per a una data determinada. Tot i que l’IA pot generar codi, imatges, textos semblants als humans i fins i tot passar exàmens amb graus diversos, sovint interpreten malament la posició de les agulles del rellotge i fallen en aritmètica bàsica de calendaris. Presentat a la Conferència Internacional sobre Representacions d’Aprenentatge (ICLR) 2025 i publicat a l’arXiv (encara no revisat per parells), l’estudi destaca importants bretxes en la capacitat de l’IA per dur a terme tasques que els humans dominen des de joves. Rohit Saxena, del University of Edinburgh i autor principal, va subratllar que aquestes deficiències s’han d‘ abordar perquè l’IA pugui aplicar-se de manera efectiva en números de temps sensibles i en contextos del món real, com ara la planificació, l’automatització i les tecnologies d’assistència. Els investigadors van provar diversos models multimodals de llenguatge gran (MLLM), incloent Llama 3. 2-Vision de Meta, Claude-3. 5 Sonnet d’Anthropic, Gemini 2. 0 de Google i GPT-4o d’OpenAI, utilitzant un conjunt de dades personalitzat d’imatges de rellotges i calendaris. Els models van fallar en identificar correctament l’hora del rellotge o determinar els dies de la setmana per a diverses dates en més de la meitat dels casos, aconseguint precisions només del 38, 7 % en els rellotges i del 26, 3 % en les tasques de calendaris. Saxena va explicar que la percepció deficient de l’IA per llegir rellotges prové de la manca de raonament espacial—tasques que requereixen detectar agulles que solapen, mesurar angles i interpretar dissenys diversos de rellotges, com números romans o dials estilititzats. Reconèixer una imatge com a rellotge és més fàcil per a l’IA que llegir-la amb precisió.
De manera similar, tot i que l’aritmètica és fonamental per a la informàtica, els models de llenguatge gran no duen a terme càlculs mitjançant algoritmes; en canvi, predicen sortides basant-se en patrons de dades d’entrenament. Això provoca raonaments inconsistents i no regles, explicant els alts índexs d’error en càlculs relacionats amb data. Aquest estudi suma evidències creixents que el mode d’“entendre” de l’IA difereix fonamentalment de la cognició humana. L’IA destaca quan disposa d’abundants exemples d’entrenament, però té dificultats amb el raonament abstracte i la generalització, especialment en tasques que combinen percepció amb una lògica precisa. A més, la disponibilitat limitada de dades per a fenòmens més rars com els anys tamanys (de traspàs) restringeix el seu rendiment, ja que l’IA no és capaç de fer les connexions conceptuals necessàries. Els resultats subratllen la necessitat de conjunts de dades més ric i dirigits i una reevaluació de la capacitat de l’IA per integrar raonament lògic i espacial, posant en evidència els riscos de dependre massa dels resultats de l’IA en tasques complexes. Saxena va destacar la necessitat de proves rigoroses, mecanismes de seguretat i supervisió humana freqüent quan l’IA ha d’utilitzar percepció i raonament exacte conjuntament.
Brief news summary
Una nova recerca presentada a la Conferència Internacional sobre Representacions d’Aprenentatge 2025 destaca limitacions significatives en els models d’IA actuals com Meta’s Llama 3.2-Vision, Anthropic’s Claude-3.5 Sonnet, Google’s Gemini 2.0 i OpenAI’s GPT-4o. Malgrat els avenços recents, aquests models tenen dificultats amb tasques que són senzilles per als humans, com llegir rellotges analògics i determinar els dies de la setmana a partir de dates. L’estudi ha descobert que aquests models interpretaven correctament els horaris del rellotge només el 38,7% de les vegades i les dates del calendari només el 26,3%, ressaltant la seva dependència del reconeixement de patrons en lloc de habilitats de raonament real. Dirigit per Rohit Saxena, de la Universitat d’Edimburg, la recerca revela que, tot i que els sistemes d’IA permeten identificar objectes amb precisió, afronten desafiaments notables amb tasques de raonament espacial i lògic complex, especialment aquelles que impliquen esdeveniments poc habituals com els anys de traspàs. Les troballes subratllen la necessitat de noves metodologies d’entrenament que integrin habilitats de raonament lògic i espacial i adverteixen contra la dependència excessiva de l’IA per a tasques que requereixen càlculs precisos. En definitiva, el estudi posa de manifest les diferències fonamentals entre la cognició humana i el reconeixement de patrons per part de l’IA, defensant una validació exhaustiva i la supervisió humana en aplicacions del món real que són sensibles al temps.
AI-powered Lead Generation in Social Media
and Search Engines
Let AI take control and automatically generate leads for you!

I'm your Content Manager, ready to handle your first test assignment
Learn how AI can help your business.
Let’s talk!

Nvidia rep una empenta a la IA, Meta troba un obs…
El pròxim camp de batalla en la cursa armamentística de la IA no és Pequín—és Riad, almenys segons Wedbush.

El Internet públic és un coll d'ampolla per a la …
Segons Austin Federa, cofundador i CEO de DoubleZero — un projecte centrat en desenvolupar rails de comunicació per fibra òptica d’alta velocitat per a cadenes de blocs — la infraestructura pública d’Internet és el principal coll d’ampolla en velocitat i rendiment per a les xarxes de blockchain de gran capacitat.

Shoosmiths incentiva l'adopció de la IA amb un bo…
A principis del mes passat, Shoosmiths, un despatx d’advocats britànic amb 1.500 empleats, va anunciar un fons de bonificacions de 1 million de lliures que es compartiria entre el personal si adoptaven de manera col·lectiva l’eina d’Intel·ligència Artificial de Microsoft, Copilot, en els seus fluxos de treball.

JP Morgan signa la primera transacció tributària …
JP Morgan ha completat la seva primera transacció en una blockchain pública,Senyalant l'auge de l'implicació del gegant financer amb l'ecosistema Web3.

Els xips d'IA són la nova "moneda del món" ja que…
© 2025 Fortune Media IP Limited.

Els bancs centrals exploren la tecnologia blockch…
Els bancs centrals comencen a investigar com les tecnologies de blockchain programable podrien transformar la implementació de la política monetària.

La mostra d'efectes especials d'IA de Star Wars v…
Si la direcció de Disney té la seva manera, serem inundats de reimplementacions, seqüeles i spin-offs interminables de Star Wars fins que el Sol exploti finalment.