lang icon Swedish
Auto-Filling SEO Website as a Gift

Launch Your AI-Powered Business and get clients!

No advertising investment needed—just results. AI finds, negotiates, and closes deals automatically

May 17, 2025, 9:16 p.m.
7

Ny studie avslöjar att AI har svårt att läsa analoga klockor och beräkna kalenderdatum

Ny forskning har identifierat ett antal arbetsuppgifter som människor hanterar utan problem, men som konstgjord intelligens (AI) har svårigheter med—specifikt att läsa analoga ur och att bestämma veckodag för ett givet datum. Även om AI kan generera kod, bilder, människoliknande text och till och med klara av prov i varierande grad, missuppfattar den ofta klockhändernas positioner och misslyckas med grundläggande räkneoperationer i kalendern. Studien presenterades vid den internationella konferensen för läranderepresentationer 2025 (ICLR) och publicerades på förpubliceringsplattformen arXiv (ännu inte peer-reviewed). Den belyser betydande brister i AI:s förmåga att utföra arbetsuppgifter som människor behärskar tidigt i livet. Rohit Saxena, huvudförfattare och forskare vid University of Edinburgh, underströk att dessa brister måste åtgärdas för att AI effektivt ska kunna tillämpas i tidskänsliga och verkliga sammanhang som schemaläggning, automation och hjälpmedelsteknologi. Forskare testade flera multimodala stora språkmodeller (MLLMs)—inklusive Metas Llama 3. 2-Vision, Anthropic’s Claude-3. 5 Sonnet, Googles Gemini 2. 0 och OpenAI’s GPT-4o—med hjälp av ett anpassat dataset av ur- och kalendersbilder. Modellerna misslyckades med att korrekt identifiera tider på klockor eller bestämma veckodagar för provdatum över hälften av gångerna, med en noggrannhet på endast 38, 7 % för klockor och 26, 3 % för kalenderuppgifter. Saxena förklarade att AI:s dåliga förmåga att läsa av klockor beror på dess brist på spatialt resonemang—arbetsuppgifter som kräver att man upptäcker överlappande visare, mäter vinklar och tolkar olika urdesigner, som romerska siffror eller stiliserade urtavlor. Att känna igen en bild som en klocka är lättare för AI än att läsa av den noggrant.

På samma sätt, trots att aritmetik är grundläggande för databehandling, utför inte stora språkmodeller beräkningar genom algoritmer; de förutspår istället utdata baserat på mönster i träningsdata. Detta resulterar i inkonsekvent och icke-regelbaserat resonemang, vilket förklarar de höga felprocenten vid datumrelaterad matematik. Denna studie förstärker den växande evidensen för att AI:s sätt att "förstå" skiljer sig fundamentalt från mänsklig kognition. AI är mycket framgångsrikt när mängder av träningsdata finns tillgängliga, men har svårigheter med abstrakt resonemang och generell anpassning—särskilt i arbetsuppgifter som blandar perception med exakt logik. Dessutom försvåras prestandan av begränsad träning på mindre vanliga fenomen, som skottdagar, eftersom AI inte kan skapa nödvändiga konceptuella kopplingar. Resultaten understryker behovet av rikare, riktade dataset och en omvärdering av AI:s förmåga att integrera logiskt och spatialt resonemang, samt lyfter fram riskerna med att förlita sig för mycket på AI:s output i komplexa arbetsuppgifter. Saxena betonade vikten av rigorös testning, fallback-mekanismer och ofta mänsklig övervakning när AI får i uppdrag att kombinera perception och exakt resonemang.



Brief news summary

Ny forskning presenterad på 2025 års Internationella Konferens om Lärande Representationer lyfter fram betydande begränsningar hos nuvarande AI-modeller som Metas Llama 3.2-Vision, Anthropic’s Claude-3.5 Sonnet, Googles Gemini 2.0 och OpenAIs GPT-4o. Trots senaste framsteg kämpar dessa modeller med uppgifter som är enkla för människor, som att läsa analoga klockor och bestämma veckodagar utifrån datum. Studien visade att dessa modeller rätt tolkade klocktid endast 38,7 % av gångerna och kalenderdatum bara 26,3 %, vilket understryker deras beroende av mönsterigenkänning snarare än verklig logisk förmåga. Ledda av Rohit Saxena från University of Edinburgh visar forskningen att medan AI-system kan identifiera objekt med hög precision, möter de betydande utmaningar med komplex spatial och logisk problemlösning, särskilt vid ovanliga händelser som skottår. Resultaten understryker behovet av nya träningsmetoder som integrerar logisk och spatial förmåga och varnar för överdrivet beroende av AI för uppgifter som kräver exakta beräkningar. Slutligen belyser studien de fundamentala skillnaderna mellan mänsklig kognition och AI:s mönsterigenkänning, och förespråkar omfattande validering och mänsklig kontroll i tidskänsliga verkliga tillämpningar.
Business on autopilot

AI-powered Lead Generation in Social Media
and Search Engines

Let AI take control and automatically generate leads for you!

I'm your Content Manager, ready to handle your first test assignment

Language

Content Maker

Our unique Content Maker allows you to create an SEO article, social media posts, and a video based on the information presented in the article

news image

Last news

The Best for your Business

Learn how AI can help your business.
Let’s talk!

May 18, 2025, 2:59 a.m.

Nvidia får en AI-boost, Meta stöter på ett AI-hin…

Nästa slagfält i AI-arschen är inte Peking – det är Riyadh, åtminstone enligt Wedbush.

May 18, 2025, 2:23 a.m.

Den allmänna internet är en flaskhals för blockch…

Enligt Austin Federa, medgrundare och vd för DoubleZero – ett projekt som fokuserar på att utveckla snabbfiberkommunikationsstolpar för blockkedjor – är den offentliga internetinfrastrukturen den främsta flaskhalsen för höghastighetsblockkedjenätverk när det gäller hastighet och prestanda.

May 18, 2025, 1:30 a.m.

Shoosmiths motiverar AI-implementering med en bon…

I början av förra månaden tillkännagav den brittiska advokatbyrån Shoosmiths, med 1500 anställda, en bonuspott på 1 miljon pund som skulle delas ut till personalen om de gemensamt införde Microsofts AI-verktyg Copilot i sina arbetsflöden.

May 18, 2025, 12:37 a.m.

JP Morgan slutför den första tokeniserade statssk…

JP Morgan har genomfört sin första transaktion på en offentlig blockkedja, vilket signalerar den finansiella jättens växande engagemang i Web3-ekosystemet.

May 18, 2025, 12:13 a.m.

AI-chips är det nya 'myntet i riket' eftersom de …

© 2025 Fortune Media IP Limited.

May 17, 2025, 11:10 p.m.

Riksbanker utforskar blockchain för att modernise…

Centralbanker börjar undersöka hur programmerbara blockchain-teknologier skulle kunna förändra genomförandet av penningpolitiken.

May 17, 2025, 10:51 p.m.

Star Wars' visning av AI-specialeffekter var en f…

Om Disney-ledningen får bestämma, kommer vi att dränkas i oändliga omarbetningar, uppföljare och spin-offs av Star Wars tills solen till slut exploderar.

All news