Une nouvelle étude révèle que l'IA rencontre des difficultés à lire les horloges analogiques et à effectuer des calculs de dates dans un calendrier

De nouvelles recherches ont identifié un ensemble de tâches que les humains exécutent sans effort, mais avec difficulté pour l'intelligence artificielle (IA) — en particulier lire des horloges analogiques et déterminer le jour de la semaine pour une date donnée. Bien que l'IA puisse générer du code, des images, du texte ressemblant à celui d’un humain, et réussir certains examens, elle interprète fréquemment incorrectement la position des aiguilles d’une horloge et échoue aux calculs calendaires de base. Présentée lors de la Conférence Internationale sur les Représentations de l’Apprentissage (ICLR) 2025 et publiée sur le serveur de prépublications arXiv (non encore évaluée par des pairs), cette étude met en évidence d’importantes lacunes dans la capacité de l’IA à réaliser des tâches que les humains maîtrisent dès leur plus jeune âge. Rohit Saxena, principal auteur et affilié à l’Université d’Édimbourg, a souligné que ces insuffisances doivent être résolues pour permettre une application efficace de l’IA dans des contextes sensibles au temps et dans le monde réel, comme la planification, l’automatisation et les technologies d’assistance. Les chercheurs ont testé divers grands modèles multimodaux de langage (MLLM) — notamment Llama 3. 2-Vision de Meta, Claude-3. 5 Sonnet d’Anthropic, Gemini 2. 0 de Google, et GPT-4o d’OpenAI — en utilisant un jeu de données personnalisé d’images d’horloges et de calendriers. Les modèles n’ont pas réussi à identifier correctement l’heure sur les horloges ou à déterminer les jours de la semaine pour des dates échantillons plus de la moitié du temps, avec des taux de précision de seulement 38, 7 % pour les horloges et 26, 3 % pour les tâches calendaires. Saxena a expliqué que la difficulté de l’IA à lire l’heure provient de son absence de raisonnement spatial — des tâches nécessitant la détection de superpositions d’aiguilles, la mesure des angles, et l’interprétation de divers designs d’horloges, comme les chiffres romains ou les cadrans stylisés. Reconnaître une image comme une horloge est plus facile pour l’IA que de la lire avec précision. De même, même si l’arithmétique est fondamentale pour l’informatique, les grands modèles de langage ne réalisent pas de calculs via des algorithmes ; ils prédisent plutôt les résultats en se basant sur les patterns de leurs données d’entraînement.
Cela conduit à un raisonnement incohérent et non basé sur des règles, ce qui explique les taux élevés d’échec dans les calculs liés aux dates. Cette étude s’ajoute à la preuve croissante que la « compréhension » de l’IA diffère fondamentalement de la cognition humaine. L’IA excelle lorsque de nombreux exemples d’apprentissage sont disponibles, mais elle rencontre des difficultés avec le raisonnement abstrait et la généralisation, surtout sur des tâches combinant perception et logique précise. Par ailleurs, la quantité limitée de données d’entraînement sur des phénomènes rares, comme les années bissextiles, limite ses performances, car l’IA ne parvient pas à faire les connections conceptuelles nécessaires. Les résultats soulignent la nécessité de constituer des jeux de données plus riches et ciblés, ainsi que de réévaluer la capacité de l’IA à intégrer le raisonnement logique et spatial. Ils mettent en lumière les risques liés à une dépendance excessive aux sorties de l’IA dans des tâches complexes. Saxena insiste sur l’importance de tests rigoureux, de mécanismes de sauvegarde et de supervision humaine régulière, surtout lorsque l’IA doit combiner perception et raisonnement précis.
Brief news summary
De nouvelles recherches présentées lors de la Conférence Internationale sur la Représentation de l'Apprentissage 2025 mettent en évidence d'importantes limites des modèles d'IA actuels tels que Llama 3.2-Vision de Meta, Claude-3.5 Sonnet d'Anthropic, Gemini 2.0 de Google, et GPT-4o d'OpenAI. Malgré les progrès récents, ces modèles rencontrent des difficultés face à des tâches simples pour les humains, comme lire des horloges analogiques et déterminer les jours de la semaine à partir de dates. L'étude a révélé que ces modèles interprètent correctement l'heure d'une horloge seulement 38,7 % du temps et les dates du calendrier à peine 26,3 %, soulignant leur dépendance à la reconnaissance de motifs plutôt qu’à de véritables capacités de raisonnement. Dirigée par Rohit Saxena de l'Université d’Édimbourg, la recherche montre que si les systèmes d'IA peuvent identifier des objets avec précision, ils rencontrent des défis notables en matière de raisonnement spatial et logique complexe, notamment lorsqu'il s'agit d'événements rares comme les années bissextiles. Les résultats soulignent la nécessité de nouvelles méthodes d’entraînement intégrant des compétences de raisonnement logique et spatial, tout en mettant en garde contre une dépendance excessive à l’IA pour des tâches nécessitant des calculs précis. En fin de compte, l’étude met en évidence les différences fondamentales entre la cognition humaine et la reconnaissance de motifs par l’IA, appelant à une validation approfondie et à une supervision humaine dans les applications concrètes sous pression temporelle.
AI-powered Lead Generation in Social Media
and Search Engines
Let AI take control and automatically generate leads for you!

I'm your Content Manager, ready to handle your first test assignment
Learn how AI can help your business.
Let’s talk!

Tendance NFT : les collections les plus populaire…
Le marché des NFT évolue en permanence, certaines collections connaissant des fluctuations à court terme de leurs indicateurs de valorisation.

Nvidia bénéficie d'un coup de pouce dans l'IA, Me…
Le prochain champ de bataille de la course aux armes de l’IA n’est pas Pékin — c’est Riyad, du moins selon Wedbush.

Internet public est un goulot d'étranglement pour…
Selon Austin Federa, cofondateur et CEO de DoubleZero — un projet axé sur le développement de rails de communication en fibre optique à haute vitesse pour les blockchains — l'infrastructure internet publique constitue le principal obstacle en termes de vitesse et de performance pour les réseaux blockchain à haut débit.

Shoosmiths incite l'adoption de l'IA avec une pri…
Au début du mois dernier, Shoosmiths, un cabinet d'avocats britannique comptant 1 500 employés, a annoncé un fonds de primes d’un million de livres sterling à distribuer parmi le personnel si celui-ci adoptait collectivement l’outil d’IA de Microsoft, Copilot, dans leurs workflows.

JP Morgan règle la première transaction de trésor…
JP Morgan a réalisé sa première transaction sur une blockchain publique, señalant l’engagement croissant du géant financier avec l’écosystème Web3.

Les puces d'IA sont le nouveau « monnaie du pouvo…
© 2025 Fortune Media IP Limited.

Les banques centrales explorent la blockchain pou…
Les banques centrales commencent à étudier comment les technologies de blockchain programmable pourraient transformer la mise en œuvre de la politique monétaire.