Nuovo studio rivela che l'IA fatica a leggere orologi analogici e a calcolare le date del calendario

Nuove ricerche hanno identificato una serie di compiti che gli esseri umani affrontano senza sforzo, ma con grande difficoltà l'intelligenza artificiale (IA) — in particolare leggere orologi analogici e determinare il giorno della settimana di una data specifica. Sebbene l’IA possa generare codice, immagini, testi simili a quelli umani e superare esami in vari modi, spesso fraintende le posizioni delle lancette degli orologi e sbaglia nel calcolo di base del calendario. Presentato alla Conferenza Internazionale sulle Rappresentazioni dell’Apprendimento (ICLR) del 2025 e pubblicato sul server di preprint arXiv (ancora in fase di revisione tra pari), lo studio mette in evidenza importanti lacune nella capacità dell’IA di eseguire compiti che gli esseri umani padroneggiano già in tenera età. Rohit Saxena, autore principale dell’università di Edimburgo, ha sottolineato che questi limiti devono essere affrontati affinché l’IA possa essere applicata efficacemente in contesti sensibili al tempo e nel mondo reale, come la pianificazione, l’automazione e le tecnologie assistive. I ricercatori hanno testato vari modelli multimodali di grandi linguaggi (MLLM) — tra cui Llama 3. 2-Vision di Meta, Claude-3. 5 Sonnet di Anthropic, Gemini 2. 0 di Google e GPT-4o di OpenAI — utilizzando un insieme di dati personalizzato di immagini di orologi e calendari. I modelli hanno fallito nel riconoscere correttamente l’ora dell’orologio o nel determinare i giorni della settimana per le date di esempio più della metà delle volte, con tassi di accuratezza del 38, 7% per gli orologi e del 26, 3% per i compiti legati al calendario. Saxena ha spiegato che la scarsa capacità dell’IA di leggere gli orologi deriva dalla mancanza di ragionamento spaziale — compiti che richiedono il rilevamento di lancette sovrapposte, misurazioni di angoli e interpretazioni di disegni di orologi diversi, come numeri romani o quadranti stilizzati. Riconoscere un’immagine come orologio è più facile per l’IA rispetto a leggerlo con precisione.
Analogamente, benché l’aritmetica sia fondamentale nel calcolo, i grandi modelli linguistici non eseguono calcoli tramite algoritmi; piuttosto, prevedono output basandosi sui pattern dei dati di addestramento. Ciò porta a ragionamenti incoerenti e senza regole, spiegando gli alti tassi di fallimento nel calcolo di date e operazioni simili. Questo studio si aggiunge alle evidenze sempre più numerose che il modo in cui l’IA “comprende” è fondamentalmente diverso dalla cognizione umana. L’IA va bene quando dispone di un’ampia quantità di esempi di addestramento, ma fatica con il ragionamento astratto e la generalizzazione, soprattutto sui compiti che combinano percezione e logica precisa. Inoltre, la limitata disponibilità di dati su fenomeni più rari, come gli anni bisestili, ostacola le prestazioni, poiché l’IA non riesce a stabilire le connessioni concettuali necessarie. I risultati evidenziano la necessità di dataset più ricchi e mirati, così come di una rivalutazione delle capacità dell’IA di integrare ragionamento logico e spaziale, segnalando i rischi di affidarsi eccessivamente agli output dell’IA in task complessi. Saxena ha sottolineato l’importanza di test rigorosi, meccanismi di fallback e di un monitoraggio umano costante quando all’IA viene affidato il compito di combinare percezione e ragionamento preciso.
Brief news summary
Nuove ricerche presentate alla Conferenza Internazionale sul Rappresentazione dell’Apprendimento 2025 evidenziano limiti significativi negli attuali modelli di intelligenza artificiale come Llama 3.2-Vision di Meta, Claude-3.5 Sonnet di Anthropic, Gemini 2.0 di Google e GPT-4o di OpenAI. Nonostante i recenti progressi, questi modelli faticano con compiti che per gli esseri umani risultano semplici, come leggere orologi analogici e determinare i giorni della settimana dalle date. Lo studio ha riscontrato che questi modelli interpretano correttamente le orari dell’orologio solo nel 38,7% dei casi e le date del calendario appena nel 26,3%, evidenziando la loro dipendenza dal riconoscimento di schemi piuttosto che da capacità di ragionamento autentico. Guidata da Rohit Saxena dell’Università di Edimburgo, la ricerca rivela che mentre i sistemi di intelligenza artificiale possono identificare con precisione gli oggetti, incontrano notevoli difficoltà con compiti complessi di ragionamento spaziale e logico, soprattutto quando si tratta di eventi meno frequenti come gli anni bisestili. I risultati sottolineano la necessità di nuovi approcci di training che integrino capacità di ragionamento logico e spaziale e mettono in guardia dal sovraccarico di fiducia nell’AI per compiti che richiedono calcoli accurati. In definitiva, lo studio evidenzia le differenze fondamentali tra la cognizione umana e il riconoscimento di schemi dell’AI, promuovendo l’importanza di una validazione approfondita e di un controllo umano nelle applicazioni reali che richiedono tempestività.
AI-powered Lead Generation in Social Media
and Search Engines
Let AI take control and automatically generate leads for you!

I'm your Content Manager, ready to handle your first test assignment
Learn how AI can help your business.
Let’s talk!

Nvidia ottiene una spinta dall'IA, Meta incontra …
Il prossimo campo di battaglia nella corsa agli armamenti dell’IA non è Pechino—è Riad, almeno secondo Wedbush.

L'internet pubblico è un collo di bottiglia per l…
Secondo Austin Federa, cofondatore e CEO di DoubleZero—un progetto incentrato sullo sviluppo di linee di comunicazione in fibra ottica ad alta velocità per le blockchain—l'infrastruttura pubblica di Internet rappresenta il principale collo di bottiglia in termini di velocità e prestazioni per le reti blockchain ad alto throughput.

Shoosmiths incentiva l'adozione dell'IA con un bo…
All'inizio dello scorso mese, Shoosmiths, uno studio legale britannico con 1.500 dipendenti, ha annunciato un fondo bonus di 1 milione di sterline da condividere tra il personale se quest'ultimo avesse adottato collettivamente lo strumento di intelligenza artificiale di Microsoft, Copilot, nei loro flussi di lavoro.

JP Morgan conclude la prima transazione di tesore…
JP Morgan ha completato la sua prima operazione su una blockchain pubblica, segnando il crescente impegno del colosso finanziario con l’ecosistema Web3.

Le chip AI sono le nuove 'moneta del regno' poich…
© 2025 Fortune Media IP Limited.

Le banche centrali esplorano la blockchain per mo…
Le banche centrali stanno iniziando a esplorare come le tecnologie di blockchain programmabile potrebbero trasformare l’attuazione della politica monetaria.

Lo spettacolo di effetti speciali di IA di Star W…
Se la dirigenza Disney avesse carta bianca, saremmo sommersi da continui reboot, sequel e spin-off di Star Wars fino a quando il Sole non esploderà.