Nieuw onderzoek toont aan dat AI moeite heeft met het lezen van analoge klokken en het berekenen van datums op de kalender

Nieuw onderzoek heeft vastgesteld dat mensen moeiteloos een reeks taken uitvoeren, waar kunstmatige intelligentie (AI) moeite mee heeft—met name het lezen van analoge klokken en het bepalen van de dag van de week voor een gegeven datum. Hoewel AI code, beelden, mensachtige teksten kan genereren en zelfs met wisselend succes toetsen kan doorstaan, interpreteert het vaak de posities van de klokwijzers verkeerd en faalt in basale kalenderberekeningen. Het onderzoek, gepresenteerd op de Internationale Conferentie over Leerrepresentaties (ICLR) 2025 en gepubliceerd op de preprint-server arXiv (nog niet peer-reviewed), benadrukt grote hiaten in het vermogen van AI om taken uit te voeren die mensen al op jonge leeftijd onder de knie krijgen. Lead-auteur Rohit Saxena van de Universiteit van Edinburgh benadrukte dat deze tekortkomingen aangepakt moeten worden zodat AI effectief toegepast kan worden in tijdsgevoelige en praktische situaties zoals planning, automatisering en assistentie-technologieën. De onderzoekers testten verschillende multimodale grote taalmodellen (MLLMs)—onder andere Meta’s Llama 3. 2-Vision, Anthropic’s Claude-3. 5 Sonnet, Google’s Gemini 2. 0 en OpenAI’s GPT-4o—met behulp van een aangepaste dataset van klok- en kalenderbeelden. De modellen faalden erin om de juiste kloktijden te herkennen of de weekdagen voor voorbeelddata te bepalen, meer dan de helft van de tijd, met nauwkeurigheidspercentages van slechts 38, 7% voor klokken en 26, 3% voor kalendertaken. Saxena legde uit dat het slechte kloklezen door AI komt doordat het gebrek heeft aan ruimtelijk redeneren—taken waarbij overlapping van wijzers, hoekmetingen en het interpreteren van diverse klokontwerpen, zoals Romeinse cijfers of gestileerde wijzerplaten, vereist zijn. Een afbeelding als een klok herkennen is voor AI makkelijker dan deze nauwkeurig lezen.
Evenzo, hoewel rekenen fundamenteel is voor computing, voeren grote taalmodellen geen berekeningen uit via algoritmes; in plaats daarvan voorspellen ze uitkomsten op basis van patronen in trainingsgegevens. Dit leidt tot inconsistente en niet-regel-gebonden redeneringen, wat de hoge foutenpercentages bij datumgerelateerde berekeningen verklaart. Dit onderzoek voegt zich bij de toenemende bewijzen dat de manier waarop AI “begrijpt” fundamenteel verschilt van menselijke cognitie. AI blinkt uit wanneer er veel trainingsvoorbeelden beschikbaar zijn, maar heeft moeite met abstract redeneren en generalisatie, vooral bij taken die perceptie combineren met precieze logica. Bovendien beperkt de beperkte hoeveelheid trainingsgegevens over zeldzamere verschijnselen zoals schrikkeljaren de prestaties, omdat AI niet in staat is om de noodzakelijke conceptuele verbanden te leggen. De bevindingen onderstrepen de noodzaak van rijkere, gerichte datasets en een herwaardering van AI’s vermogen om logische en ruimtelijke redeneringen te integreren, waarmee de risico’s van overmatige afhankelijkheid van AI-uitvoer bij complexe taken benadrukt worden. Saxena benadrukte dat rigoureus testen, fallback-mechanismen en vaak menselijk toezicht noodzakelijk zijn wanneer AI wordt ingezet voor het combineren van perceptie en exact redeneren.
Brief news summary
Nieuw onderzoek gepresenteerd op de International Conference on Learning Representations 2025 benadrukt aanzienlijke beperkingen in huidige AI-modellen zoals Meta’s Llama 3.2-Vision, Anthropic’s Claude-3.5 Sonnet, Google’s Gemini 2.0 en OpenAI’s GPT-4o. Ondanks recente vooruitgang worstelen deze modellen met taken die voor mensen eenvoudig zijn, zoals het lezen van analoge klokken en het bepalen van weekdagen aan de hand van data. De studie toonde aan dat deze modellen kloktijden slechts in 38,7% van de gevallen correct interpreteerden en dat kalenderdata slechts in 26,3% van de gevallen juist waren, wat hun afhankelijkheid van patroonherkenning benadrukt in plaats van echte redeneringsvaardigheden. Onder leiding van Rohit Saxena van de University of Edinburgh onthult het onderzoek dat terwijl AI-systemen objecten nauwkeurig kunnen identificeren, ze aanzienlijke uitdagingen ondervinden bij complexe ruimtelijke en logische redeneringstaken, vooral bij zeldzame gebeurtenissen zoals schrikkeljaren. De bevindingen onderstrepen de noodzaak van nieuwe trainingsmethoden die logische en ruimtelijke redeneervaardigheden integreren en waarschuwen voor een te grote afhankelijkheid van AI bij taken die precieze berekeningen vereisen. Uiteindelijk benadrukt de studie fundamentele verschillen tussen menselijke cognitie en patroonherkenning door AI, en pleit voor uitgebreide validatie en menselijk toezicht in tijdkritieke toepassingen in de praktijk.
AI-powered Lead Generation in Social Media
and Search Engines
Let AI take control and automatically generate leads for you!

I'm your Content Manager, ready to handle your first test assignment
Learn how AI can help your business.
Let’s talk!

NFT-trend: de populairste collecties van dit mome…
De NFT-markt ontwikkelt zich voortdurend, waarbij sommige verzamelingen korte termijn schommelingen in hun waarderingsstatistieken ondervinden.

Nvidia krijgt een AI-boost, Meta stuit op een AI-…
De volgende speelruimte in de wapenwedloop van AI vindt niet plaats in Peking—maar in Riyad, althans volgens Wedbush.

Het openbare internet is een knelpunt voor blockc…
Volgens Austin Federa, mede-oprichter en CEO van DoubleZero — een project dat zich richt op het ontwikkelen van hogesnelheids-vezelcommunicatiestaten voor blockchains — is de publieke internetinfrastructuur de belangrijkste snelheid- en prestatieknelpunt voor high-throughput blockchain-netwerken.

Shoosmiths stimuleert adoptie van AI met een bonu…
Begin vorige maand kondigde Shoosmiths, een Brits advocatenkantoor met 1500 werknemers, een bonuspot van €1 miljoen aan die onder het personeel gedeeld zou worden als zij gezamenlijk Microsoft's AI-instrument, Copilot, in hun werkzaamheden zouden integreren.

J.P. Morgan Lost de eerste getokeniseerde schatki…
JP Morgan heeft zijn eerste transactie op een openbare blockchain voltooid, wat wijst op de groeiende betrokkenheid van de financiële reus bij het Web3-ecosysteem.

AI-chips zijn de nieuwe 'munteenheid van de werel…
© 2025 Fortune Media IP Limited.

Centrale banken onderzoeken blockchain om het mon…
Centrale banken beginnen te onderzoeken hoe programmeerbare blockchain-technologieën de implementatie van monetair beleid zouden kunnen transformeren.